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実用 C 言語 

— 関数の作り方 • 使い方一 
中田利秋•串崎充共著 
(A 5判 144頁） 

PC -9800 シリーズで動く Microsoft C , 
Lattice C および DeSmet C を対象に，サ 
ブルーチンとしての C 関数の作り方•使 
い方を豊富な実例とプログラムリストに 
沿って詳解します. 
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ので，学習を終えた段階では，ファイル 
を自由に操ることができ，学習前には考 
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(A 5判212頁) 
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(B 5判336頁) 
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訳者序文 


本書は C 言語の普通の入門書ではありません . C 言語の演算子や制御文につ 
いてある程度知っている（またはそれらを書いた本が手近にある）ことが前提に 
なっています.しかし，初心者が C プログラムを書くときに，ミスをしがちな 
点についてその原因がわかるような知識が多く書かれています.特に次のことが 
上げられます. 

• コンパイラの構成要素とコンパイラはどのように動くか 
• C 言語が実際に展開されるアセンブラ.プログラム 
• C プログラムの設計の仕方と，プログラムの書式 
• 実際的なボインタの使用と多重化した間接アクセス 
• 再帰関数 

• デバッグの問題と解決法 

さらに，洗練されたボインタの使用法や不定数の引数を持つ関数の話題も取り 
上げられています.このようなプログラムの予備知識を適切に書いている本はほ 
とんどありません.私は，翻訳者としてではなく （初心者の後輩を持つ）中級プ 
ログラマとして，本書を翻訳して良かったと思っています. 

最後になりましたが，オーム社出版部の方々（度々原稿が遅れてごめんなさ 
い），本書を翻訳する機会を与えてくれた奥田真純氏，中川原亮氏に，深く感謝 
いたします. 

1989年9月 


村上峰子 
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はじめに 


C 言語のテキストは，たいていとても教養ある読者向けか，または，まだ未熟 
な読者向けに書かれている.どちらのタイプのテキストも共通の問題を持ってい 
る.それは，技術的な予備知識となる説明を欠いているということである.初級 
用のテキストでは，読者はそのような説明はわからないと想定しているし，上級 
用のテキストでは読者はすでに必要な知識を持っているものとしている. 

中間レベルのプログラマにとって，基礎的なテキストは退屈で，十分に広範囲 
な内容ではない.それはプログラマにとって真に必要なことを載せていない. 

初心者の C プログラマにとっては，さらに困難な問題がある • C 言語が，どの 
ように動作するのかをほんとうに理解する前に，たくさんの予備知識が必要とな 
る.初心者はさまざまな演算子が何をするのか，ましてそれらがどう使われるの 
かもわからない.それで，予備知識なしで言語を学ぼうとして失敗している•ま 
た，コンピュータの下部構造がわからなければ， C プログラムをデバッグするこ 
ともたいへん難しい.このような予備知識を与えていなければ，”初心者のため 
の C 言語”のようなテキストは，実際には読者を欺いていることになる.必要条 
件なしで言語を学ぶことはできない. 

本書では，2つの方法でこの問題を解決している. C 言語をマスターすること 
と， カーニハンと リッチ—（参考文献参照）が書いたような典型的なテキストを 
理解すること双方に役立つ予備知識を述べている.また，ポインタの洗練された 
使いかたや，可変数の引数を持ったサブルーチンのような上級向けの話題につい 
ても詳しく取り上げている. 
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本書の使いかた 

本書からは C の初歩は学べない.実際には，読者は本書を使いながら一般のテ 
キストを参考に勉強するはずである.次の2つのうち，ひとつの方法で本書を使 
うことができる.1章から順に，本書と一般の本の章とを交互に読む.あるいは， 
多少なりともでたらめな章順に読む.もっとも基本的な章でさえ読者が言語につ 
いて（例えば変数の宣言方法や， while ループとは何か等）少しは知っていると 
仮定している. 

本書は4つのセクションに分けられる.1〜5章は技術的な予備知識を扱ってい 
る. 6章はポインタの概論であり，この題材はたいていのテキストに含まれてい 
る.しかし，異なる視点から再び取り上げるのは有意義であろう . 7〜9章は C 言 
語の応用に発展している.これは読者の知識を磨くのに役立つだろう.これらの 
章では， C 言語の完全な知識が要求される.最後に，10章では一般的なデ八ッグ 
の問題について扱っている.各章は次のような構成になっている. 

1. コンパイラの使用 

1章では， C コンパイラの各部とそれらが互いにどう動くかを討議す る . プリ 
プロセッサ，コンパイラ，リンカ，ライブラリアン等は，モジュラ.プログラミ 
ングの基本的概念としてす ベて 説明され ている . この章では， c プログラマに役 
立つ make のようないくつかの補助プログラムを取り上げ ている . 


2. 基本原則： 2進数演算 

ここでは，2進数演算の基本原則を討議する.討議には，種々の基数，ある基 
数から別の基数への変換のしかた，計算機で負数をどう表すか，乗算と除算のし 
かた，単純なブール代数などを含む.そして，計算機での計算方法によって C プ 
ログラムに生じる問題に重点をおいている. 
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3. C プログラマのためのアセンブリ言語プログラミング 

3章では，あるやりかたでアセンブリ言語について説明する.それは， C での処 
理の仕方を読者が理解する助けになるだろう.種々のアドレッシング.モードと 
簡単なオペレーシヨン，また，同時にメモリ•アライメントについても述べてい 
る. 

4. コード生成とサブルーチンの結合 

4章では，（デコンパイラが，通常，生成するコードを討議する.また，サブル 
—チンがどのように呼ばれるかについても詳述する. C プログラムにおけるささ 
いでみ つけるのが難しいバグの多くは，誤ったサブルーチン結合の結果である. 
この章は，そのようなバグをより簡単に発見する助けとなるだろう.ただし，読 
者は，4章を読む前に3章の内容を理解しておくべきである • 

5. モジュラ • プログラミング 

5章では，大きな C プログラムの設計と書きかたについて述べる.また，フォ 
—マット規則についても同様に述べる. 

6. ポインタ 

ここでは，ポインタの基本原理が詳しく討議される.ポインタは， C 言語にお 
いて，もっとも理解しにくい部分である•そして，たいていのテキストでは十分 
に扱って いない •題材は実際の面から扱われている.この章では，メイルボック 
スのようなものに頼るのでなく，むしろ種々のボインタが計算機の中で実際にど 
う動いているかを説明する.読者はこの章を読む前に3章の内容を理解しておく 
べきである. 
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7. 高度なポインタ 

7 章は， 6 章の終わりの部分からの続きである.ポインタの複雑な使用，多重レ 
ベルの間接，ポインタと配列を使った複合型等にっいて詳しく調べる.また， 
複合型の宣言文もここで詳しく表している.この章ではハードウエア•インタフ 
エースについても 討議される（例えば， IBM-PC の メモ リ マップ.デイス プレイ 
にアセンブリ言語を使わずに直接働きかける方法を討議する）. 

8. 再帰呼出しとコンパイラ理論 

ここでは，再帰呼出しについて述べる.再帰呼出しのサブルーチンが繰り返し 
呼ばれているときに，計算機内で実際に何が行われているのかをみることによっ 
て，再帰呼出しがどのように動作するのかを詳しく調べる.小さなコンパイラ 
のような語句解析プログラムを解析して，再帰呼出しの実際的な使用もみてみる. 
読者は，この章を読む前に 4 章と 6 章の内容を理解しておくべきである. 

9. printf () :可変数の引数を持ったサブルーチン 

ここでは， print () の変形版をみて， C の複雑なアプリケーションを検討する. 
読者は，この章を始める前に 7 章と 8 章を理解しておく必要がある. 

10. デバッギング 

10章では，さまざまなデバッギング上の問題を検討する•そして，これらの問 
題の解決法にっいて述べる. 

本書の C プログラムは，小さな例題やポインタの章で，やや奇妙に思える資料 
を含んでいるが，すべて IBM PC/AT 上で Microsoft C Compiler version 3 .0 
を使用してテストされている.これらのプログラムは， Lattice version 3. X ，ま 
たは UNIX で問題なく走るはずである.他のコンハ。イラについては保証できない 
が，それが標準に準拠しているならば問題はないはずである. 
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C コンパイラ 


本章では， c コンパイラがどのように構成されているか，そして，一般にそれ 
がどう使われているかを紹介する.また， C プログラマに役立つ， C コンパイラ 
以外のいくつかの補助プログラム （ grep や make のような）も紹介する.すべての 
C コンパイラは構造上は同様だが，実際にプログラムをコンパイルするやり方は 
コンパイラによってまったく異なる.読者は自分のコンパイラの使用方法を知る 
ために，コンパイラのドキュメンテーションを調べるべきである.本章では，コ 
ンパイラが共通して持っている部分とその部分がどう使われるかを検討する•な 
お，本書では UNIX とマイクロソフト社のコンパイラを使用する. 

1.1 コンパイラの各部 

C コンパイラは通常ひとつ，または，協調して動く複数のプログラムからなる. 
コンパイレイション自体はいくつかのフェーズ（ phase ) に分割され，各フェーズ 
はひとつ，または複数のパスに含まれている.あるフェーズは，実際のコンパイ 
ルが始まる前に行われなければならない.例えば，コンパイラのプリプロセッサ. 
フェーズは，ソース•コードからすべてのコメント文を取り除き，そして，すべ 
てのマクロ （# define や称 ifdef 等）を置き換える.プリプロセッサ•フェーズの 
出力は，コンパイラの字句解析フェーズに渡される.字句解析フェーズは，入力 
された文字を他のフェーズが使いやすい内部表現に変換する.一方，パスは，入 
カファイルの読込みと出カファイルの生成を含んでいる.コンパイラの第1ハ。ス 
(パス 1) はソース•ファイルを読んで，一時的な出カファイルを生成する.パ 
ス2はこの一時的なファイル（テンポラリ.ファイル）を読む，そして，代わり 
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にパス2の出カファイルを生成する.処理は，実行可能プログラムができるまで 
続く.コンパイラのいくつかのフェーズは，しばしば結合されてひとつのパスに 
なる.たいていのコンパイラは，少なくとも3つのパスからなる.マイクロソフ 
卜社の（デコンパイラは，実際4パスである （4 つのプログラム p 0. exe ， pl . exe ， 
p 2. exe ， p 3. exe がある）. 

コンパイラのフェーズは，しばしばドライバ.プログラムによって隠されてい 
る. UNIX プログラムの cc や，マイクロソフト社の cl と msc がその例である. 
ドライバは，他のプログラムをまるでサブルーチンのように走らせるプログラム 
である.サブプログラムは，テンポラリ•ファイルを通して互いに通信する•そ 
して，ドライバは，コマンドを使って他のプログラムと通信する. msc ドライバ 
は， p 0. exe ， pl . exe ，. ••と順序良く実行する.ドライ八は，テンポラリ•ファイ 
ルがもはや必要なくなったときにそれを削除する.そして，同様にそのほかのハ 
ウスキーピング ( 訳注 1》 も削除する.たとえ，パスの動きが隠されているとしても， 

さまざまなパスが何をしているか知ることは有益である•コンパイラを構成して 
いるプログラムを図 1.1 に示す. 


osof t 

UNIX 

機能 

cl 

c c 

ドライ/く.プログラム 

pO 

cpp 

C プリプロセッサ（パス 1 ) 

Pi 

cO 

C コンパイラパス 2 

P 2 

cl 

C コンパイラパス 3 

p 3 

c 2 

C オプティマイザ（最適化ハ。ス 4) 

masm 

as 

アセンブラ 

link 

Id 

リンカ 

lib 

a r 

ライブラリアン 


図卜 1 

コンパイラのパス 


UNIX コンパイラ cc のいくつかの バージョンは，コマンドに - v を規定すれば， 
これらすベてのプログラムが実行されるときにその名前を表示する.図 1.2 はコ 
ンパイラのさまざまなフェーズ間の関係を示す.それぞれのパスによって生成さ 
れたテンポラリ•フアイルも示されている. 

UNIX の cc ドライバをみることによって，ドライバがどのように使われている 
かを示そう（マイク ロソフ トの cl ドライバは， CC にとても似ている）. CC のコマ 

訳注1:—般には「問題の解に関与しないプログラム内のルーチン.入出力装置に必要な予備的操作ルー 
チン.」 
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紙に書いたメモ 


UNIX 

プログラム名 


VI 

ex 


cpp 


(^ソースコードと stdio . h のようなシステム.インクルード•ファ’ 


ルを含む ASCII テキスト•ファイル. 


プリプロセッサ 


ASCII テキスト.コメントは除かれ，すべての#命令（社 define , 

# include , 等）は処理されている.一時ファイルはいつも生成され 
るとは限らない.もしあれば， . i イクステンションを持つ. 


通常，複数のプログラム. 

プログラム間の通信のための， 
確定な名前の一時フアイル. 


ぐイナリデータを含んだ不 


ASCII テキスト.アセンブリ言語のソースコード. 

ファイルはたいてい . asm ( CP / M ， DOS ) か，または， . s ( UNIX ) 
イクステンションを持つ. 


アセンブラ 


他の目的 

モジュール 


'il 


バイナリ，最配置可能目的モジュール.機械語に大変近い，ただし， 
実行可能ではない.ファイルは，通常， . obj , . rel , または ， UNIX 
で.〇イクステンションを持つ. 

Iibe.a a r 

他の目的 


ライブラ 1 


ライブラリア： 


モジニ 


-ル 


バイナリ 実行可能 ファイル， 通常， . exe か . com イクステンション 
を 持つ. UNIX はリンク時に-〇オプションを付けなければ a . out 
というファイルを生成する. 

コンパイレ彳シヨン完了 

図1 . 2 C コンパイラのさまざまなパス 


エディタ 


である.ここで， files はファイル名である.ファイル名が .c で終わっていれば， 
そのファイルを CC は C プログラムであるとする.同様に，ファイル名の終わりが 
. S ならばアセンブリ.プログラム， . 0ならばオブジェクト•モジュールであると 
する.ファイル名のイクステンション （. C ，. S , または. 0) に基づいて， CC はコ 
ンパイル，アセンブル，または，さまざまなファイルを適切にリンクする（これ 
らの動作は，あとで詳しく説明する.）.次のコマンドを例に説明する. 


解解^ 
一句文、 
1子構日 
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c c hickory.c dickory.s doc.o 

hickory . c はコンハ。イルされ （ cpp ， cO ， cl を使用する），アセンブルされる （as 
を使用する）. dickory . s はアセンブルだけされる （ as を使用する）.これらの処理 
で， hickory . 〇と dickory . 〇が生成される.次に， hickory . 〇， dickory . 〇と doc . 〇 
が同時にリンクされ （ Id を使用する）.さらに，スタンダード•ライブラリ （ libc.a 
と呼ぶ）が自動的にプログラムにリンクされる•最後に，生成されたテンポラリ. 
ファイル （ hickory . 〇， dickory . 〇を含む）が cc によってすべて削除される. 

cc は，コマンドにいくつかのスイッチを使う.さらに， cc は自身に関係のない 
スイッチをリンカ ( Id ) に渡す.次に cc のより有用ないくつかのオプションを記 
す. 

-c コンハ。イルはするが，リンクはしない.コマンドに規定した 

各 . C または . S のファイルに対応する目的モジュール （• 0イ 
クステンションがついている）が生成される.しかし，これ 
らの目的モジュールはリンクはされない.このオプションは 
makefile を使うときに役立つ（このことについては簡単に後述 
する）. 

-Dname name に対する# define 文をつくる.これはおもにデバッグに 

使われる.例えば，デバッグ用の部分を 

#ifdef DEBUG 

printf("This is a debug diagnostic"); 

# e n d i f 

のように # ifdef , ttendif で囲むことができる.もしプログラ 
ムを 

cc -DDEBUG prog.c 

でコンパイルすれば ， printf () 文はコンパイルされるだろう. 
また，マクロに値を割り当てることもできる. 

cc -DPROCESSOR=8086 prog.c 
は プロ グラムに次の文をつくる. 

//define PROCESSOR 8086 

-0 最適化をするパス （ CC 2) を呼びだす.コマンドで-〇を規定 

しなければコードは最適化されない • -〇が規定されるとコンパ 
イルに時間がかかるため，デバッグ作業が完了するまで通常は 


1.1 コンパイラの各部 
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使用されない.このオプションは次のオプション-〇 name と混 
同すべきではない. 

-〇 name この-〇 name を指定しなければ， a . out にリンクされること 

になる.しかし，例えば 

cc -〇 reindeer dasher.c dancer . c donner.c b Li tzen.c 

は最終的に， a . out ではなく， reindeer にリンクする. 

-s アセンブリ言語のファイルを生成し，そして終了する.その 

ファイルは . s イクステンション（マイクロソフト社を使ってい 
れば， . asm ) を持つ. 

1.1.1 プリプロセッサ 

プリプロセッサは，エディタでつくられたアスキー形式のテキストを入力とす 
る.慣習では， C 言語のソースファイル名は . c イクステンション （ program , c の 
ように）で終わり，インクルード•ファイル （# include 機能でプログラムに組み 
込む）はそのファイル名の最後に . h を持っ. 

プリプロセッサは，2種類の機能を持っている.ひとつは，ソースコードから 
すべてのコメントを取り除くこと，そして，もうひとつはプリプロセッサへのす 
ベての命令を処理することである . C ではこれらの命令はすべて最初の文字が# 
である.ほとんどのコンパイラによってサポートされているプリプロセッサ命令 
が，図 1.3 に示されている.互換性を保つために，#はつねにもっとも左のカラ 
ムにあるべきであり，#に続いてどんな空白（ブランク，タブ，改行）もおくべ 
きではない（たとえ読者のコンパイラが，空白をいれてあってもかまわないとし 
ても）. 


#de t 1 ne - 

#undef - 

# 1 ncIude - 

# 1 f d e f - 

ffif - 

#e L se - 

//end i f - 


マクロの定義，識別子を文字列と置換する 
マクロの取リ消し 

この命令のある行をファイルの内容と置換する 

マクロが先に# define で定義されていればコンパイルする 

式が真ならばコンパイルする 

先行する# if の式が真でない，または，林 ifdef の識別子が 

未定義のときコンパイルする 

# if , # ifdef , # else の範囲の終わり 

図1 • 3共通のプリプロセッサ命令 


すべてのプリプロセッサ命令は，ある種の文字列の置き換えを含んでいる.例 




えば，マクロの呼出しは，さきに# define 命令で定義された文字列が置き換えら 
れる. # include 命令は，命令の一部で定義されたファイルの内容と置き換わる. 
また， # ifdef 命令は，文字列を削除する（ヌル文字列で置き換える）こともでき 
る等である. 

プリプロセッサは，コンパイラの一部ではない.プリプロセッサは， C の構文 
や優先順位を理解しない（何が識別子かは知っているけれども）.これがわからな 
いために，いくつかのバグが起こりうる.例えば 

//define PR I N TS ( s ) printf(" string is <%s> " , s ); 

が 


PRINTS( buf ); 

で呼ばれると，次のように展開される. 


同様に 


p rin t f("s t r 1 n g is <%buf>", buf); 


//define SQUARE(x) (x * x) 


が 


y = SQUAR E( va r + + ); 

で呼ばれたとき，次のように展開される （ var が2回インクリメントされる）. 


y = (var + + * var + + ); 

3 番目の例は， SQUARE が 

y = SQUARE(x + y); 

で呼ばれたとき，次のように展開する. 

y=(x+y*x+y) 

演算子*は演算子+より優先度が高いので，この式は次のように評価される. 

y = ( x + (y * x) + y) 

これは，期待どおりではない.この最後の問題は， SQUARE を 
//define SQUARE(x) ( (x) * (x)) 

で再定義することにより解決できる•マクロを使うときは，よく注意すべきで 
ある. 

多くの コンパイ ラは，プリプロセッサが処理した後も， ソース コードでの位置 
がわかるようにするオプションがある.これは，複雑なマクロを使用していると 
きのデバッグにも有効である.例えば， CC と cl はどちらもコマンドに - P があれ 
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ば，プリプロセッサの出カファイルが生成される（この出カファイルはどちらの 
コンパイラも . i イクステンションを持っている）. UNIX プリプロセッサ ( ccp ) 
は，完全に独立したプログラムなので，プリプロセッサだけを走らせることがで 
きる. ccp はハ ib ディレクトリにあるので注意すること.もし/ lib が自分のサー 
チ. パスに なければ， ccp プログラムを走らせるために，次に記す フル•パスネー 
ムを与えなければならないだろう. 

/I1 b / cpp prog.c prog.i 


1.1.2 コンパイラ 

コンハ。イレイションの次の段階は少なくとも4つのフェーズを含んでいる.そ 
れらは字句解析，構文解析，最適化，コード生成である（字句解析と構文解析は 
8章で詳述する）.最初の2つのフヱーズはその間に，一般的なアセンブリ.コー 
ドのような中間コードからなるファイルを生成する. 

最適化は中間コードを人力とし，そして，その所要記憶容量を小さくし，より 
速く走らせるようにする.たいてい，この両方の長所を同時に得ることはできな 
い.コードを小さくするか，速く実行するか，どちらか一方しかできない. cc は， 
コマンドに -0 があるときだけ最適化を行う.そのため，プログラムのデバッグ 
をしているときに，最適化に時間を費やさなくてすむ.最適化は，予想できない 
やり方でコードを再配置する.したがって，アセンブリ言語のデバッガ （symdeb 
や adb ) を使うのなら最適化はしないほうがよい. 

最適化は，順序をばらばらに変えられた中間コードを出力する.コード生成の 
パスは，この中間コードをアセンブリ言語に翻訳する.コード生成以外のすべて 
のコンパイレイションを行うことが，汎用のフロントエンドにすることを可能に 
する.異なるコード生成プログラムに置き換えることによって，コンパイラの他 
の部分の修正をせず，さまざまな計算機にあった目的コードをつくることができる. 

4つのフェーズすべてが，ひとつのハ。スで行われることがある.けれども，多 
くのものは，字句解析と構文解析がひとつのプログラムによって行われ，最適化 
は第2の，そして，コード生成は第3のプログラムで行われる. 

1.1.3 アセンブラ 

アセンブラは，アセンブラ言語を人力とし，実行可能コードにとても近いもの 


を出力として生成する.ァセンブリ言語の中間ファイルをつくらないですむよう 
にコード生成フェーズに組み込まれているアセンブラもある.しかし，アセンブ 
リ言語のプログラムも出力することができる機能を持っているものが多い •（CC 
と cl ではコマンドに - S オプションをつけてコンパイルできる）.多くのコンハ。 
イラは，アセンブリ言語の出力に，コメントとして C 言語のソースコードを揷人 
できる. 

コンパイラによってつくられたアセンブリ言語をみることができるのは，とて 
も重要なことである. adb , ddt , symdeb ， または， debug のようなデバッガを使 
用するためには，ァセンブリ言語を必要とする.さらに，特に効率について関心 
があるならば，コンハ。イラがハイレベルの構造で処理した内容を厳密にみること 
は有益だろう.コンパイラには，多くのほかのプログラムと同様に，バグがある. 
これは，8086ラージモデルのコンパイレイシ ョン や，いくつかの新しいコンパイ 
ラについては特にそうである.もしアセンブリコードをみることができれば，コ 
ンパイラが正しいコードを生成したかどうかわかる （ C をアセンブリ言語に関係 
付けるのは容易である.しかし Pascal ， LISP , APL のような言語では容易では 
ない）.アセンブリ言語をみることの最大の理由は，「手」による最適化である. 
最初からアセンブリ言語で書くより， C でプログラムを書き，コンパイルし，そ 
れから計算機で生成されたァセンブリ言語を手で最適化するほうがたやすい. 

UNIX のアセンブラ ( as ) とマイクロソフト社のアセンブラ （ masm ) は独立し 
たプログラムであり，それだけで走らせることができる.慣例では， UNIX のア 
センブリ•ソース•ファイルは . s のイクステンションがあり， MS - DOS のファ 
イルは. asm がある. 

アセンブラの出力は，再配置可能な目的モジュールである（しばしば，単にモ 
ジュールと呼ばれる）. Pascal とは違い， C プログラムは通常，いくつかのファイ 
ルに分けて書かれる.これらのソースファイルは別々にコンパイルされ，コンパ 
イレイションの最後の段階（次にみるリンカによって）でつなぎ合わされる.あ 
るファイルに存在するサブル_チンは，第2のファイルに存在する，ほかのサブ 
ルーチンを呼ぶことができる.しかし，コンパイラは，第1のサブルーチンをコ 
ンパイルしているときに，第2のサブルーチンがメモリのどこにあるかを知るこ 
とはできない（なぜなら，2つは異なるファイルにあるからである）.同じ状況 
が，グローバル変数でも起こる•すなわち，あるファイルで定義されたサブルー 
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チンが，他のファイルで定義されたグローバル変数を使うことがありうる.しか 
し，コンパイラはグローバル変数が存在するところを知る方法がない.このよう 
な，他のファイルにあるサブルーチンや変数は，外部オブジェクトと呼ばれる. 

アセンブラは，できるところまでは機械語に翻訳しようとする.それは，外部 
オブジェクトがメモリのどこにあるのかわからないからである.しかしながら， 
仮のアドレスで，外部オブジェクトへのすベての参照を置き換える.それから， 
それらの仮のアドレスの位置とおのおのの仮のアドレスに関連する変数の名前を 
リンカに知らせる表をつくる. 

再配置可能な目的モジュールは，外部オブジヱクトにアクセスする前にパッチ 
されなければならないから，実行可能ではない.リンカに通した後で実行させな 
ければならない. 

1.1.4 リンカ，またはリンク•エディタ 

リンカは，さきに述べたコンパイレイション処理の結果できた再配置可能な目 
的モジュールの表を入力とする.次に，それらのモジュールをひとつのプログラ 
ムにつなぎ合わせる.そして，すべての仮のアドレスを本当のアドレスで置き換 
える•例えば，コマンド 

cc -c Larry.c 
cc - c curly.c 
cc - c moe . c 

は，ファイル larry. c, curly, c, moe. c にある C のソースコードをコンパイルおよ 
びアセンブルし， 3 つの目的モジュール larry. 〇， curly. 〇， moe. 〇をつくる.それ 
から，それらのファイルは，リンカを使ってひとつの 実行可能 プログラムに変え 
られる.すなわち 

Id -〇 stooges larry . 〇 curLy.o moe.o -L c 

である.別のやり方は 

cc -o stooges larry.o curly.o moe.o 

である. Id は， stooges という 実行可能 プログラムを 生成す る（—〇だから）. -lc は， 
コマンド に与えられた 3 つのモジュールを printf( ) のような標準 I/O ルーチンを 
含んでいる標準ライブラリ /lib/libc. a とリンクすることを Id に知らせる • -lc は 
Id ではなく cc を使うときには必要ない.マイクロソフト社の cl ドライバは cc が 
使用されたのと同様に使うことができる.マイクロソフト社のリンカは 
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Link L ar ry.o curly.o moe.o,stooges.exe,,libc.lib 

で libc . lib を明示して呼び出される.ここで，コンマで区切られた第2の引数が出 
カファイル名である•もし，第3の引数があればリンクマップがつくられるだろ 
う（リンクマップは，すべての外部オブジェクトとそれらのメモリ上の実際の位 
置の表である）.最後の引数は，プログラムの終わりにリンクされるライブラリの 
名前である. 

リンカの機能をより詳しく説明する前に，専門的な説明をしなければならない. 
C (適切には，力ーニハンとリッチー の 場合）は，変数 や サブルー チンの 宣言と定 
義を区別して いる. 宣言と いう 言葉は告知を意味して いる. それで，変数宣言は 
コンパイラに 変数の存在を知らせて いる. また，宣言では記憶を割り当てず，た 
だ， コンパイラに 変数がどこかに存在することを知らせるだけで ある.コンパイ 
ラは，リ ンク 時にリンカが変数のありかをみつけることを想定して いる. 変数定 
義は，実際に変数に対して記憶を割り当てる.つまり実際に変数をつくる. 

このことば一定義と宣言一の選択は適切で ない.なぜなら，たいていの 文献で 
は，宣言ということばは変数に割り当てられている記憶の場所を参照するのに使 
われている.これは，カーニハンとリッチーが使っていることばの意味とは反対 
である.結論として，私は本書では一貫してより広く受け入れられている意味で， 
2つのことばを使用してきた （2 つのことばを区別して いない. すなわち，2つの 
ことばは，カーニハンとリッチーがいうところの定義と同じ意味で使われる）.必 
要があれば，私は，定義と宣言の代わりに，割当て （ allocation ) と参照 （ reference ) 
を使う. 

しかしながら，この区別は重要である.ひとつの変数に対する記憶は，ただひ 
とつの場所にだけ割り当てられる.けれども，変数は，それを必要とする多くの 
ファイルから参照することができる. C では，参照は予約語 extern でつくられる. 
すなわち， extern は，名前付き変数（または，サブル_チン）が他のファイルに 
定義されていることをコンパイラに知らせる.しかし，変数がまるで現在のファ 
イルに定義されているように使用可能であることも意味している（リンカが変数 
の実際の位置をみつけるだろう）. extern で宣言されている変数には記憶は割り 
当てられない.もし extern がなければ，そのとき記憶が変数に対して割り当てら 
れる（理論的には，コンパイラがリンカに割当てをさせることもある.これにつ 
いてはのちほど説明する）.特に，外部サブルーチン（変数ではない）は，使うだ 
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けで暗黙のうちに外部サブルーチンであると宣言することができる.この場合， 
そのサブルーチンは int を返すものとされる. 

リンカの仕事は，すべてのサブルーチンと変数の参照を，それらの宣言と結び 
付けることである.さらに，リンカが変数の宣言をみつけられなければ（つまり， 
参照しかなければ），通常は変数に対して記憶を割り当てる.これは，リンカに記 
憶を割り当てさせるコンハ。イラに問題を起こすかもしれない（予約語 extern がな 
いときに，コンパイラ自身が記憶割当てを行うよりも）.このコンパイラは，同じ 
名前を持った2つの静的でないグローバル変数を，同じ変数であると想定する. 
実に頭の痛い問題である.後の章でこの問題を回避する方法を検討する. 

リンカは，つなぎ合わせた目的モジュールを，次の2つのうちひとつの形にす 
ることができる.アセンブラからの出力のような，ファイル別に独立した目的モ 
ジュールか，または，ライブラリ （ library ) である.ライブラリは，ひとつのファ 
イル（通常，名前に . lib イクステンションを持っている）に合併された目的モジュー 
ルの集合である.ファイル内のモジュールは個々に独立している.しかし，リン 
力のコマンドには，ひとつのファイルにおかれているので，必要なモジュール名 
を長く連ねないでひとつのファイル名を書く. 

ひとつの目的モジュールを分けることはできない.つまリ，ライブラリが走査 
されるときに，もし特定のモジュール内のひとつのサブルーチンが必要ならば， 
たとえ同じモジュール内の他のサブルーチンが必要でなくとも，モジュール全体 
が最終的なファイルに出力される.最初に，ひとつのソースコードにあったすべ 
てのサブルーチンと，広域データはひとつの目的モジュールになる.このように， 
ソースコードのレベルでは，ひとつのモジュールはひとつのファイルと同じであ 
る.このソースコードとファイルの関係は，ライブラリに対しては保持されない. 
ライブラリは，複数の目的モジュールを含むひとつのファイルだからである.ひ 
とつのモジュールは，単一のファイルで始まったひとかたまりのコードである. 
しかし，ライブラリは複数のモジュールを含む単ーファイルである.モジュール 
とファイルはこのレベルでは同一ではない. 

リンカは，ライブラリの必要とされる（参照される）モジュールだけを最終的 
なプログラムに組み込む.一方で，ライブラリに含まれていない独立した目的モ 
ジュールがコマンド上にあれば，それは実際に使用されなくとも，必ず最終的な 


プログラムに人っている. 


12 


1 .C コンパイ ラ 


リンカを使用することの真の利点は，いったんプログラム修正が終わると，修 
正したファイルだけを再びコンパイルすればよいことである（そのプログラムに 
はまだ他のファイルに目的モジュールがあるとする）.それから，新しい目的モ 
ジュールを使ってプログラムを再びリンクすることができる. 

1.1.5 ライブラリアンとライブラリ 

厳密にいえば，ライブラリアンはコンパイラの一部ではない.ライブラリをつ 
くり，維持するためにだけ使用される独立したプログラムである.たいていのラ 
イブラリアンは，ライブラリをつくり，ライブラリにモジュールを加え，ライブ 
ラリからモジュールを削除し，ライブラリにあるモジュールを同じ名前の新しい 
モジュールで置き換えることができる.ライブラリから，ひとつのモジュールを 
抜き取れるライブラリアンもある（ライブラリ.ファイルからモジュールを取り 
除き，自動的にひとつの.〇，または. obj ファイルにおく.それはまるで最初から 
ライブラリにはおかれていなかったかのようである）. 

ライブラリにある モジュールは， その モジュール 内のサブ ルーチ ンや データが 
使用されていなければ，最終的なプログラムには含まれない.そのため，ライブ 
ラリは通常かなり大きい.ライブラリは，複数のサブルーチンを含む モジュール 
が 100個以上あることもしばしばある.例えば，読者のコンパイラの資料に記述 
されているライブラリ •ルーチンは， すべて個別の モジュール であり，かつ，す 
ベて同じライブラリ•ファイルの一部分である. 

多くのリンカは，ライブラリをはじめから終わリまで1度走査するだけである. 
したがって，モジュールがライブラリに挿入される順番がしばしば重要になる. 
リンカは，すべての未解決外部変数の表を管理する.走査している間に，その表 
にある外部参照と同じ名前を持つサブルーチンがみつかれば，リンカはそのサブ 
ルーチンを含んでいるモジュールを最終的なプログラムに挿入する.新しく挿入 
されたモジュールに外部サブルーチン参照があれば，この新しい参照をリンカの 
表に加える.そして，ライブラリ内のサブルーチンがやはりライブラリ内にあるサ 
ブルーチンを呼んでいるならば，呼びだされるサブルーチンを含んでいるモジュー 
ルが，そのサブルーチンを呼ぶモジュールの後になければならない. B 乎ぶほうの 
サブルーチンが挿入された後に，呼ばれるほうのサブルーチンはライブラリにお 
かれていなければならない.モジュール内のサブルーチンは，すべて最終的なプ 
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ログラムの一部になるから，モジュール内のサブルーチンの順番は重要ではない. 
特に，でたらめな順番のライブラリでも受け入れるリンカは，きれいに並んだラ 
イブラリを与えられるとより速く動作するだろう. • 

ライブラリに入れられるモジュールでもうひとつ考慮することは，モジュール 
内のサブルーチンの数である.ライブラリ•モジュールは，通常外部から参照さ 
れることが可能なサブルーチンをひとつだけ持つことができる （ static で宣言さ 
れたサブルーチンは，外部からの参照は不可能である）.モジュール内の他のサブ 
ルーチンは，ひとつの外部ルーチンを補助するはずである.モジュールを小さく 
つくることによって，最終的なプログラムで使われないサブルーチンをリンクせ 
ずに，プログラムのサイズを小さくする. 

リンカがひとつのプログラムを編集するとき，サブルーチンの能力がすべて実 
際に使用されているかどうか知る方法はない.サブルーチンに対する呼出しがす 
でにリンクされているコードにあるかどうかということだけがわかる.これは， 
汎用の出力関数 fprintf( ) のようなハイレベルの関数を使用するときに問題を生 
じる. fprintf( ) はスクリーンへも，ファイルへも，どのような MS-DOS のデバ 
イスにも書くことができる.したがって， stderr にエラーメッセージを書くため 
だけに fprintf( ) を使っているのかもしれないのに，仮にそれを使えば，最終的 
なプログラムは，ほとんどディスク•インターフエース•ライブラリになってし 
まう.リンカは fprintf( ) のディスタに関係ある機能の中の使わない部分がわか 
らない.つまり， fprintf( ) でディスクに書くということだけがわかる.同様に， 
fprintf( ) は 浮動 小数を書くことができる.したがって，たとえ整数を書くために 
fprintf( ) を使うだけでも， 浮動 小数計算のライブラリもすベて最終的なプログラ 
ムに入ってしまう. 

この問題には2つの解決策がある.汎用の関数を使わないようにするか，また 
は，自分用の fprintf( ) の変形版を書くことである.最初の方法は汎用のルーチ 
ンの小さな部分を使うときには実用的である.つまり，文字列を書くためだけに 
fprintf( ) を使っているならば，代わりに fputs( ) を使うことができる.自分用 
の fprintf( ) の変形版を書くという第 2 の解法は，長い目で見ればより実用的で 
ある.多くのコンハ。イラの製造業者はほとんど独自の，いくつかのライブラリを 
コンパイラとともに供給している.これらのライブラリのひとつは浮動小数に対 
処できない fprintf( ) の変形版を含んでいるだろう.別のライブラリは，デイス 
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クには書けない fprintf () の変形版を含んでいるだろう•リンク時に適当なライ 
ブラリを選ぶことによって，最終的なプログラムに入れる fprintf () の版を選択 
することができる. 

もうひとつ関連した問題がある.コマンド上に明示して，リンカに与えられた 
すべての目的モジュール（ライブラリの一部ではない）は，最終的なプログラム 
に入れられる.リンカがライブラリを走査するとき，まだ，ないサブルーチンだ 
けを探す.自分用のライブラリ•ルーチン（もとのライブラリ.ルーチンと同じ 
名前である）をつくり，リンカのコマンドにそのルーチンを含んでいるモジュー 
ル名 を書くならば，自分でつくったルーチンが最終的なプログラムの一部とされ 
る.そのとき，リンカはライブラリにある同じ名前のサブルーチンを探そうとはし 
ない.ここで，問題は，ライブラリ内にある他のサブルーチンが，置き換えられた 
サブルーチンを呼んでいるかも知れないことである.呼出しの点では，自分のルー 
チンを標準のライブラリ.ルーチンに正確に似せるよう特に注意しなければならな 
い•つまり，自分のルーチンは通常のライブラリ•ルーチンと同じ引数を持たせ，同 
じ値を返すようにする.たとえ戻り値や引数をひとつも使わないとしてもである. 

コンパイラのメーカーから供給されている標準のライブラリは，たとえ標準の 
I / O ライブラリのルーチンは使用しないとしても，最終的なプログラムにリンク 
されなければならない.コンパイラは，2〜3の小さなサブルーチンが，最終的な 
プログラムにあり，それらのサブルーチンが標準ライブラリのルーチンを呼ぶこ 
とを想定している.このルーチンの集まりは，実行時ライブラリと呼ばれ，通常， 
I / O ルーチンとともに標準ライブラリ•ファイルにおかれている.実行時ライブ 
ラリ•ルーチンは，倍精度計算や switch 文の処理などを行う. 

特に興味をひくひとつの実行時サブルーチンは， root または start - up モジュー 
ルである. root モジュールはオペレーテイング.システムから制御を受け取るサ 
ブルーチンである. main () サブルーチンは他のサブルーチンのように， root モ 
ジュールから呼ばれる （ main () は，他と同様に，単なるサブルーチンである. 
main () 関数を必要とするただひとつの理由は， root モジュールがそれを呼ぶか 
らである.だから，リンカは main () の存在を要求する）. root モジュールは I/O 
ライブラリで使用されているさまざまなグローバル変数を初期化する.通常，コ 
マンド•ラインから受けとった argv 配列（注 1) を組み立てる. CP / M や初期 

注1:コマンドの引数が入っている文字列へのボインタの配列. 
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の MS - DOS のようなオペレーティング.システムでは，入出力切換えも root モ 
ジュールで行われる. 

root モジュールの使用は，プログラムをできるだけ小さくしようとするときに 
も利益がある.切換えはディスクを使うから，明示して切換えをするならば ， root 
モジュールは全体のディスク I / O システムを呼ぶだろう.切換えを行わないよう 
に root モジュールを書き換えることによって，切換えを阻むことができる（この 
処理の例は参考文献にある）. root モジュールと同じ名前のサブルーチンを書い 
て，自分のプログラムにそのサブルーチンをリンクすることができる. main () は 
root モジュールに呼ばれるので，自分で root モジュールを書くのならば main () 
サブルーチンは必要ではない. 

UNIX では，標準ライブラリ （/ lib / libc . a ) が自動的に cc によってプログラムに 
リンクされる.マイクロソフト社のリンカは，コンパイラがリンカに対して，目 
的モジュールに，標準ライブラリを使用するための情報を入れるなら，リンクす 
る.けれども，すべてのコンパイラが，この情報を入れるわけではない（ここに 
書いたように，マイクロソフト社の C コンパイラは入れるが， Lattice のコンパイ 
ラは入れない）. 

UNIX では，いくつかデフォルト.ライブラリ（標準ライブラリにカロえて）が供 
給されている（これらのルーチンは UNIX マニュアルのセクション3に書かれて 
いる）.この付力卩されたライブラリは/ lib か / usr / lib ディレクトリにある.それら 
は libm . a (計算ライブラリ）や， libs , a (標準ライブラリ）の名前を持っている•マ 
ニュ アルのセクション3にあるサブルーチンを使用するときには， cc か Id の コマ 
ンドではっきりとライブラリを規定しなければならない.ライブラリの名前は， 
マニュアルの ページの 見出しのところに ある. 例えば， q S ort () の 見出しは次の 
ようになっている. 

QS0RK3C) UNIX 5.0 QS0RT(3C) 

qsort () は， libc . a (見出しには C がある）にあり， Id か cc のコマンドに _ lc を 
おくことによってプログラムに libc がリンクされる. - IX は文字列 / lib / libX . a の 
簡略形である. - lc と/ lib / libc . a は同じに扱われる.もし Id が/ lib にそのライブ 
ラリをみつけられなければ， / usr / lib でも探すだろう.したがって， - lm と/ usr / 
lib / libm . a も等しい.探しているライブラリが/ lib または/ usr / lib ディレクトリ 
になければ，コマンドにフル•パスネームを書き出さなければならない •（ j SOr t () 


16 


1 .C コンパイ ラ 


を使用している sort , c というプログラムの cc コマンドの例は 

cc sort.c - I c 

である. - lc は， libc にあるサブルーチンを呼ぶ，すべてのモジュール名の後にな 
ければならない.リンカは，それらサブルーチンへの參照をみつけるまで，ライ 
ブラリからどのサブルーチンを必要とするのかわからない.それで，リンカはラ 
イブラリを走査する前に，ライブラリ関数を参照するすべてのモジュールを処理 
しておかなければならない. 

1.1.5.1 ライブラリ•メンテナンス 

ライブラリは，アーカイブ （ archive ) とも呼ばれる.したがって， UNIX ライ 
ブラリ管理プログラムは， ar と呼ばれる.アーカイブは，単一のファイルに編集 
されたファイルの集合である.それは， C の目的モジュールを含む必要はない. 
けれども， MS - DOS ライブラリはそれほど汎用性はない. MS - DOS のライブラ 
リは，汎用のアーカイブによってではなく，ライブラリアン （ librarian ) という， 
特別なユーティリティでつくられている （ DOS では，さまざまなファイル維持プ 
ログラムが使用可能であるけれども，それらはライブラリをつくることはできな 

ぃ) • 

アーカイブは，ライブラリ以外にも使用される.サブ.ディレクトリを持たな 
い CP / M システムでは，ディスクをきれいにするのを助ける.例えば，ひとつの 
ライブラリの全部のソース.ファイルをひとつのアーカイブに組み込む.その後 
は，ディレクトリ内のひとつの要素にみえる.また，アーカイブはモデムを通し 
て他のコンピュータにファイルを転送するのにも役立つ.たくさんの小さなファ 
イルを送るより，ひとつのアーカイブ•ファイルを送ることができる.アーカイ 
ブ.ファイルを使う他の主な理由は，ディスクの記憶を節約できることである. 
たいていのオペレーティング•システムでは，たとえ，ファイルがたくさんの記 
憶を必要としなくても，すべてのファイルが最小の記憶単位を要求する.例えば， 
最小限の512バイトのディスク•セクタが，1文字分の長さのファイルを保持す 
るのに必要とされる.たいていのオペレーティング.システムがひとつのディス 
ク•セクタを使用していないので，問題はさらにひどくなる.むしろ，最小の記 
憶割当て単位として，いくつかのセクタからなるクラスタを使う.このように， 
オペレーティング.システムが4セクタのクラスタを使用していれば，4*512， 
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すなわち，2048バイトが1バイトのファイルを収納するために使われる.アーカ 
イブは，いくつかの小さなファイルからつくられるので，浪費する記憶量を最小 
にする. 

前にも述べたが， UNIX のアーカイブ管理ユーティリティは ar という • ar で 
アーカイブの生成，アーカイブへのファイルの挿入，アーカイブからのファイル 
の 削除， ファイルの 出力 （アーカイブからファイルを 削除し ないで），アーカイブ. 
ファイルの入換え，そして，そのほかの 簡単な 管理作業ができる. 

4つのファイル， one . c , two . c , three , c , four , c があるとする.次のコマンド 
で，これらのファイルを含むアーカイブ•ファイルをつくることができる. 
ar r v files.arc one . c t wo . c three.c four.c 
第 2 の引数 （ rv ) は ar にするべきことを教える.ここで， r は指示されたファイ 
ルを入れ換えることを意味する.ファイルがアーカイブになければ，アーカイブ 
にそのファイルを加える.通常， UNIX のユーティリティでは引数の前にあるマ 
イナス記号がここでは使われていないことに注意する . v は ar に実行中の内容を 
知らせるように指示している.コマンドの次の引数 files , arc はアーカイブ•ファ 
イルの名前である.したがって，残りの引数がこのコマンドが使用するファイル 
である.ファイルはアーカイブにコピーされる.つまり，ファイルは処理の一部 
として削除されない. 

マイクロソフト社のライブラリアンでのコマンド （ lib と呼ばれる）は 

L 1 b f 1 Ie s. I 1 b + o n e . o b j + t w o.o bi +three.obj + f o u r . o b j ; 

である. 4 つのモジュール，すなわち， one . obj ， two . obj , three , obj , four , obj 
を含む files , lib というライブラリをつくる. 

さて UNIX に話を戻す.ファイル three , c を次のコマンドで調べることが 
できる. 

ar p f 1 le s . a r c three.c > t h e r e . c 

ファイルは標準出力に印刷される.それで，アーカイブからファイルを抜き出 
したいのならば，出力の切換えを行わなければならない.マイクロソフト社のラ 
イブラリは，目的モジュ_ルだけを含むことができるから， lib とは同一のコマン 
ドではない. 

ar tv files.arc 

は，ァーカイブ内のファイルの全情報を出力する. V はロング形式で出力させる. 
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v がなければ，ファイル名だけが出力される. DOS での同様のコマンドは 

Lib files.Iib ,, file s.n d x ; 

である.コンマで区切られた空白は lib に行うべき作業がないことを指示している- 
しかし， 3 番目のフィールドで lib にファイル files, ndx にインデックスをつくるよ 
う指示している. 

a r d files.arc t h r ee . c 

はア_カイブから three.c を削除する.マイクロソフト社での，同様のコマンドは 

L 1 b files.lib -1 h r e e . 〇 b j ; 


である. 

いくつか他にも，ライブラリに関連したプログラムが， UNIX でサポートされ 
ている.例えば， lorder と tsort は ar とともに動作して，順序よく並んだライブ 
ラリをつくる. lorder は，目的モジュールの集合を入力とする.モジュール内の 
サブルーチン間の呼出し関係を決定し，呼出し関係のあるファイル名を対にして 
出力する.その出力は， tsort に渡される. tsort は，目的ファイル名を並びかえ 
る.そのために，モジュールがその順序でライブラリに挿入されるならば，前方 
参照はなくなるだろう. 

例えば， 3 つのファイル， larry. 〇, curly. 〇, moe. 〇からなるライブラリをつく 
りたいとする.これらのファイルのおのおのが，単一のサブルーチン [larry ( ), 
curly ( ), moe( ) と呼ばれる]でできている.サブルーチン moe( ) は larry() 
を呼び， larry( ) は curly( ) を呼んでいる.したがって， moe( ) は larry( ) や 
curly () より前にライブラリに挿入されていなければならない.同様に， larry () 
は curly( ) より前に挿入されていなければならない.このコマンド 
Lorder Larry . 〇 curly . 〇 moe . 〇 | tsort 


は，次の表を生成する. 

moe . 〇 
I a r r y . 〇 
c u r l y . o 

この出力には， moe () に続いて moe () に呼ばれるサブルーチンを含んだモ 
ジュール larry () がある.同様に，続いて curly () がある. lorder / tsort から 
の出力を次のコマンドで ar に渡すことができる • 

ar c r stooges 1 lorder l a r r y.o curly.o moe.o | tsort' 

ここではバツク•クオートを使っており，通常のシングル•クオートではない 
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ことに注意するべきである. 

ライブラリが順序よく並んでいることの利点は，リンカに，よりはやく走査さ 
れるので，コンパイル時間を短縮できることである.けれども，いつも順序よく 
並んだライブラリを持つことができるとは限らない.そのために， UNIX には 
ranlib 機能が与えられている. ranlib は，でたらめに並んだライブラリの名前を 
入力とする. ranlib は，リンカが必要とする関数を探すために使うシンボル.テ ー 
ブル （--. SYMDEF と呼ばれる）をライブラリに挿入する.例えば 

ar cr stooges l a r ry . 〇 curly.o moe.o 
ranlib stooges 

は，でたらめに並んだライブラリ stooges をつくり，リンカがすべての必要な閨 
数をアクセスすることができるように，そのライブラリを修正する. 

マイクロソフト 社のライブラリはでたらめに並んでいても よい. けれども，順 
序よく並んだライブラリのほうがでたらめなものよりもはやくリ ンク できる.だか 
ら，順序よくライブラリをつくることは価値がある.残念ながら，私は MS-DOS 
のもとで走る lorder や tsort については知らない. 

1.2 モジュラ.プログラミング 

モジュールは， C プログラムの重要な部分である.だから，どのようにプログ 
ラムのモジュール構成をするか考えることが重要である.ライブラリ•モジ ュ_ 
ルはできるだけ小さくつくるべきである.これは，大きなモジュールでプログラ 
ムをつくるのが大変だからではない.小さいモジュール構成の方が，維持管理の 
面でよいからである.ひとつのモジュールにあるサブルーチンは，すべて機能的 
に関連しているべきである（デバッグ中に，ひとつのファイルから別のファイル 
へと移る必要がないようにするべきである）.十分に汎用性のあるサブルーチン 
は，大きなファイルに埋め込むよりも，ライブラリにおくべきである. 

モ ジュールをいつしよ にするときに重要なことは， グローバル 変数と マクロの 
配分である.できれば， グローパ’ル 変数はひとつのモ ジュールに 通用範囲を限定 
するべきである.つまり， グロー八ル 変数は他のモ ジュール にあるサブ ルーチン 
に使われるべきではない（これは，維持管理のために第1にされることである. 

5章で詳しく討議する）.同じことが: ft define , typedef などにもいえる.つまり， 
できればそれらもひとつの モジュール 内でのみ使われるべき である. しかし，時 
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にはこのような構成はできない.それで， C は# include 命令を用意している. 

# include 〈 files 〉 文は，ソースコード内に指定されたファイルの内容全部と置き換 
えられる.そのように使われるファイルはインクルード•ファイルと呼ばれ，そ 
のファイル名は . h で終わらなければならない. 

インクルード • ファイルには，決して実行可能コードや変数宣言を含むべきで 
はない.それらは， . c ファイルにおいてコンパイルし，通常のやり方で最終プロ 
グラムにリンクするべきである.インクルード•ファイルには井 define, typedef, 
extern 文だけが含まれるべきである.# include 文は入れ子構造 （nesting ; . h ファ 
イルにまた# include 文をおく）ことができるけれども，維持管理の理由から一般 
によい考えではない.少なくとも2つ以上のファイルに使われるのでなければ， 
インクルード•ファイルに書くべきではない.逆に，2つ以上のファイルに使わ 
れるすべての# define , typedef , extern 文は，全 ソース •ファイルに組み込ま 
れる . h ファイルにおかれるべきである.グローバル変数などは，プログラム中 
に散在させるよりも，ひとつの場所に集中させるほうが変更しやすい. 

1.3 他の役立つプログラム 

C プログラマの仕事を，より簡単にする UNIX ユーティリティをいくつか取り 
上げる.これらには MS - DOS 版もある. 

1.3.1 grep 

grep は，文書ファイル中のパターンを探すプログラムである.パターンは，特 
に強力な型で規定されている.その型は“ページのもっとも左のカラムから始め 
て，空白やタブ，開かっこ，いろいろな文字の繰返し，閉かっこ，セミコロン以 
外のものが続く a から z の範囲の文字列”の発見を可能にする. grep は，複数 
ファイル構成の C プログラムでファイル間参照をつくるのに使うことができる. 

リンカが未解決の参照だと思うようなつづりの間違ったサブルーチン名をみつけ 
たり，製作中のオペレーテ ィング. システムを構成する45個のファイルのうち 
のひとつにサブルーチンの宣言がないことをみつけたりするのにも役立つ. 

grep は正規表現 （regular expression ) と呼ばれる表記法を使用してファイルの 
内容と照合してパターンを探す.正規表現は照合する文字の組合せとメタキャラ 
クタ （ metacharacter ) と呼ばれる特殊記号からできている.メタキャラクタを次 


にあげておく. 
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^ 行の始まりと照合する. 

$ 行の終わりと照合する. 

/ 次にある文字と照合する.この場合， /* はアスタリスクを照合し，/. 

はピリオドを照合する. 

. どんな文字とも照合する. 

[] [] で囲まれた文字列が，文字の種類 （character class ) を規定する.そ 

の文字列内のどの1文字とでも照合する.例えば， [ abc ] は a , b , または 
c と照合する. ASCII 文字コードの範囲は [ a - zO -9] のように省略形で書く 
ことができる.[に続く最初の文字が△ならば，範囲外の文字 （negative 
character class ) を規定する.この場合， [] で囲まれた文字範囲外のす 
ベての文字と照合する（いいかえれば， [3-2] は英小文字以外のすべての 
文字と照合する）.範囲外の指定は，必ず何かと照合しなければならない. 
しかし，その何かは範囲内の文字ではない•例えば，六$は ，[ z ]$ と同じ 
ではない.最初の例は空行（行の始まりに行の終わりが続いている）を照 
合する. 2番目の例は z 以外の文字があって，行の終わりが続く行の始め 
と照合する. 2番目の例では，行に文字がひとつなければならない.しか 
し，その文字は z では駄目である.*.，と$は[]の中では特殊文字で 
はないことに注意すること. 

* * の前の正規表現と同じものがあってもなくてもよい. 

+ +の前の正規表現と同じものが1回以上ある. 

ee 連結された2つの正規表現の，最初の正規表現に2番目の正規表現が続 

いているところがあるか照合する. 

I I か改行で分けられた2つの正規表現の最初か2番目の正規表現と同じ 

ものがあるか照合する. 

優先順位は[]，*，連結，丨，改行である. greedy アルゴリズムが*と十を処 

理するために使われている.それで， a . * z は左端が a で始まり右端が z で終わ 

る文字列を照合する.その間には， a や z を含めて文字がいくつかあってもよい. 

たいていの UNIX には， grep , egrep , fgrep と呼ばれる grep の 3 つの 変形版があ 

る.それらは，コマンドがわずかに異なるので，詳しい使用方法は自分のマニ ュ 

アルを引くべきである. gr 印自身は，限定された正規表現文しか認識しない（例 
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えば，メタキャラクタ I を認識しなぃ）. egrep はさきにあげたすベてのメタキャ 
ラクタを認識する.概して， gr 印が3つの中でもっとも便利で， egrep がもっと 
も強力である. 

ぃくつか例をみてみよう.コマンド 

egrep -nf index.exp *.c 

は，大きな C プログラムのファイル間の参照表をつくる. 

ここで，ファイル indef . exp の内容は 

A [a-zA-Z_]+.*([ A ；]*)[ A ；]*$ 

へ # define[ ] + [a-zA-Z_] + ( 

である.ファイル間の參照表は，サブルーチン名とサブルーチンのようなマクロ 
の名前を含む.名前が .C で終わるすべてのファイルが調べられる.各出力行には， 
その行があったファイルの名前 （2 つ以上のファイルを調べたときは自動的に行わ 
れる）と行番号 （_ n があるので）がさきに書かれる. 

indef . exp には2つの行があるから，どちらの正規表現にもマッチするすべての 
行が出力される.正規表現は，以下のように解釈される. 

^[a-zA-Z_]+.*([ A ；]*)[ A ；]*$ 

は，行の始めに（^)，文字か下線 （[ a - zA - z 」） が一回以上 （+ ) あり，またどん 
な文字でもゼロ回以上あリ（.*)，開カッコが続き （（ ），セミコロン以外の文字 
をゼロ回以上繰り返して（い;]*)，閉カッコが続き （ ）），セミコロン以外の文字 
をゼロ回以上繰り返して（レ;]*)，行が終わる （$)• 

A #define[ ] + [a-zA-Z_] + ( 

は，行の始まりに，文字列# define があリ （# define )， 少なくともひとつの空白 
かタブが続き （[]+:[] の間に空白かタブ記号 （1) がある），少なくともひと 
つは文字か下線が続き （[ a - zA - Z 」+ )， すぐに（区切りの空白をおかずに）開カッ 
コが続く. 

gr 印は通常，コマンドに正規表現を書ぃて呼び出される.シヱルにとっても特 
別な意味を持つ*ゃ丨の使用には注意すること.どちらの文字も前にバックスラッ 
シュをおくか，または，全体の表現をクオートで囲まなければならなぃ.例えば 

grep "extern.*foo" *.c 

は， foo の全 extern 宣言を求めてすベてのファイルを探す.式中の * は，クオー 
卜があるためにシェルには影響しなぃだろう.しかし， *. c の*はシェルに解釈 
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される.さきの例は，次のコマンド行でも実行できる. 

egrep " A [a-zA-Z_]+.*([ A ;]*)[ A ;]*$| A #define[ ] + [a-zA-Z_] + (•" *.c 

ここで，丨は元のファイルにあった改行と同じ機能を持つ. 

1.3.2 lint 

lint は，潜在的な問題を突き止めるのに，通常のコンパイラよりももっと厳密に 
C プログラムのチェックを行う. lint は，サブルーチンに渡す引数の個数の間違 
い（あるいは誤った型の引数）や，または，正しい型に割り当てられないサ ブルー 
チンの返り値のようなものをみつける. lint は演算子の通常でない使用（条件文で 
ニ ニ の代わりに=を使う）や，初期値の代入されていない変数の參照，暗黙の型変 
換によって起こる切捨て等を潜在的なエラーとして示す. lint は，単純なエラーを 
みつけるのに役立つ. 一方， 完全に問題のないプログラムにエラー•メッセージ 
や警告を発生することもある.そのため，アプリケーションによってはまったく 
役立たない. 

lint は，実際にはコンパイラの変形版である. lint は，出力としてコードよりも 
エラー •メッセージを生成する.そのため，コンパイラが使用される場合とまった 
く同じように使われる.ひとつの違いは， lint はソース • コード上で操作している 
ので，リンカと同じではないことである.プログラム中のすべてのモジュールを 
同時に lint に通したくなければ，本当のファイルの代わりに仮のサブルーチン宣 
言を含んだ特別なファイルを lint に与えることができる.その仮のサブルーチン 
宣言は次のようなものである. 

long f 〇〇 ( a , b) int a; long b; < return OL ; > 

この仮の宣言は， エラー •チェックをするために必要なことをすベて lint に知 
らせている.これは，完全なサブルーチンよりもはやく処理される. 

1.3.3 Make 

make は実際に使用するまでは，どうしてわざわざそれを使うのかわからない 
という，ユーテイリテイのひとつである.そして，使ってからは make なしでは 
どうしたらよいかわからなくなる. make は，プログラムの自動コ ンハ 。イレイ ショ 
ン • ユーテイリテイである. make は47モジュールで構成されているある巨大な 
プログラムの中で再コ ン パイルしなければならないものを（与えられた ルール か 
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ら）決定し，それらのモジュールだけを再コンパイルする.また，インクル_ド. 
ファイルを書き換えたとき，再コンパイルしなければならないものを区別するこ 
ともできる. make は， 依存関係を保持す ることによって，これらすべてを行う. 
C のソース•ファイルよりも，後に修正されたインクル_ド•ファイルがあれば 
(または， C のソース•ファイルが目的ファイルより後で修正されていれば），そ 
のファイルは再コンパイルされなければならないことを make に教えておく. make 
は，複数のファイルに分割された大きなプログラムを 維持管理す るために，貴重 
な手助けになる.幸いなことに， make には MS - DOS 版もいくつかある.その 
ため， make を使うために UNIX は必ずしも必要ではない. 

make は makefile を入力とする. makefile は大きなプログラムのすべてのモ 
ジュールとそのモジュール間の関係を記述しているファイルである. makefile を 
使用して， make はどのモジュールを再コンパイルするべきか決定し，そして， 
それらのモジュールだけを再コンパイルする. make は， C プログラムと C コン 
パイラがどのように動作するのか知っていて， 絶対必要な 作業だけを行うインテ 
リジェント.パ、 ツ チ.ユーテイリテイのようなものである. 

make を説明するもっともよい方法は，例をあげることである. farm という目 
的 プロ グラムをつくりたいとしよう.もとのソース.プログラムは， 3つのファ 
イル， cow . c ， pig . c ， farm , c に分割されている. 3つのファイル全部が，# include 
く stdio . h > 文を含んでいる.さらに， cow . c ， pig . c は # include “ animals , h ” 文を 
含んでいる.さて， COW. C にある何かを変更したとしたら， COW. C を再コンパイ 
ルして，新しい cow . obj を farm exe に再リンクしなければならないだろう. 


n 

ft MaK e farm using c c 

n 


farm: 

C O W . 0 

pig.o farm.o 


c c -o 

farm c ow.o pig.o farm 

c o w . o : 

C 0 w . c 

stdio.h animals.h 


c c -c 

c o w . c 

p i g • o : 

pig-c 

stdio.h animals.h 


c c -c 

P i 9 • c 

f a r m . o : 

farm. 

c s t d i o . h 


c c -c 

f a r m . c 


図 1• 4 簡単な makefile 




1.3 他の役立つプログラム 


25 


animals , h の何かを変更するとしたら， cow . c と pig . c を再コンパイルして，再 1 J 
ンクしなければならないだろう. stdio . h を変更したとすれば，すべてを再コンパ 
イルする必要があるだろう. make は，依存関係として，これらのファイルの関 
係を記述する. makefile は，この依存関係の表である.今述べたプログラムの 
makefile を図卜4に示す. 

: ft ： はコメント行を示す . farm exe は cow . 〇， pig . 〇， farm . 〇からできている. 
だから， cow . 〇， pig . 〇， farm . 〇のうちいずれかが farm より後で変更されたら， 
farm は再生成されなければならない.この再生成は ， cc -o farm cow . 〇 pig . 〇 
farm . 〇が実行されることによって行われる.同様に，ファイル pig . c ， stdio . h , 
animals , h のいずれかが pig . 〇より後で変更されれば， pig . 〇は，コマンド cc _c 
pig . c で再生成される必要がある • - c は，目的モジュールをつくってリンクはし 
ない.おのおのの依存関係に関連した作業は数行に及ぶ.この処理を行わせるに 
は， make コマンドをタイプするだけでよい. make は makefile を読み，そこに 
ある情報を使って何をするべきか理解して，それを行う. 

マイク ロソフ ト社のコ ンパ イラや， MS-DOS のコンパイラを使用しているなら 
ば，たったいま引用した例では farm は farm , exe と呼ばれる.同様に，すべての 
. 〇ファイルは. obj という名前になる.最後に，プログラム名 cc は，マイクロソ 
フト社のドライバ•プログラム名 cl に変更される.それ以外は， makefile は同様 
である. 

make は，作業を少し簡単にするオプションをいくつかサポートしている.マ 
クロは，タイプする量を減らすために使われるかもしれない.マクロは 

INCLUDES = stdio.h a n i m a l s.h 

OBJECTS = cow.o pig.o farm.o 

COMPILE 二 cc -c 

farm: $(0BJECTS) 

cc -o farm $(0BJECTS) 

cow.o: $( I NCLUDES) cow.c 

$(COMP ILE) cow 

pig.o: $( INCLUDES) pig.c 

$(COMP ILE) pig 

farm.o: stdio.h f a r m . c 

$(COMPILE) farm 

図 1• 5 マクロを使用した makefile 
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name = stuff 

で定義される.ここで， name はマクロ名であリ， stuff は置き換えられるテキスト 
である.このマクロは，$ ( name ) で置き換えられる.マクロを使用した makefile 
を図1，5に示す. 

この makefile は，もっと簡単にできる.すべての . c ファイルが，同じ手順で 
.〇ファイルに変換されることに注意すること. make は，このような同じ手順を 
繰り返し行うために，依存関係の一般化 （generic dependency ) と呼ばれる機構が 
ある.図 1*6 に示す makefile を考える. 


n 

ft Make farm using the Lattice C compiler. 
U 

INCLUDES = stdio.h a nim a L s.h 
OBJECTS = cow.o pig.o farm.o 

.c . o : 

c c - c $ * . c 

farm: $(0BJECTS) 

cc -o farm cow.o pig.o farm.o 

cow.o: $(INCLUDES) 

pig.o: $( INCLUDES) 

farm.o: stdio.h 

図 1.6 汎用の makefile 


.c . o : 

cc -c $* . c 

の行は，次のことを意味している. . C ファイルから .0 ファイルをつくるために， 

c C _ C $ * . c 

を実行する. $* は，先に定義したマクロである.それは，つくられるファイル 
名（関係する行のコロンの左側にある ） のルート部分（イクステンションを除い 
た部分）になる.すなわち，次のような関係する行， 

f 〇〇 . 〇 : too . c ra t. h 

があるとすると， $* は文字列 foo になる.この依存関係の一般化の場合は ， make 
はすべての . 〇ファイルが同じルート名を持つ • c ファイルに依存していると想定 
する.すなわち， foo . obj ファイルがつくられるときには， foo . c との依存関係が 
想定され，関係する行に foo . c がある必要はない. 




1.4 練 


習 
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コンパイレイション処理を始めるには，ただ， make とタイプすればよい.依 
存関係は， make によって調べられ，そして，適切な動作が行われる. make は， 
コマンド上に処理したいファイル名を指定すると，その目的ファイルだけを再コ 
ンパイルすることもできる.例えば 

make p 1 g . 〇 

は pig . c だけを再コンパイルする ( pig . o をつくり直す必要があれば）. 

2つのオプションが特に有用である.オプション -t ( touch ( 沢注 2》 の意味）は，ま 
るでプログラムを再コンパイルしたかのように最後の更新時刻をかえる.実際には 
コンパイレイションは行われていない.このオプションはコメントだけを変更して， 
プログラム全体を再コンパイルしたくないときなどに有効である.オプション -i 
は， make に呼び出したコマンドから返されたエラー•コードを無視させる.通 
常，コンパイラが make にエラーを返すと，コマンドは終了する.もしコマンド 
上に - i が規定されていれば， make は実行を続ける.このオプションは，長い時 
間がかかるコンパイルを始めて，昼食にでも行きたいときに役立つ•コンパイル 
は，たとえエラーがあっても続けられる.必ず make の出力をファイルに切り換 
えておくこと（いいかえれば ， make -i >& err ). さもなければ，エラー•メッ 
セージはスクリーン上を消えてゆき，2度とみることができなくなるだろう. 


1.4 練 習 


1-1 getchar () を使用して1行のテキストを読んで， putchar () を使用してそ 
の行をプリントするプログラムを書きなさい.プログラムは3つのファイ 
ルに分ける.入カルーチンを含むファイルと， main () を含むファイルと， 
出カルーチンを含むファイルである.ファイルは，別々にコンパイルして， 
いっしょにリンクしなさい. 

1-2 読者のコンパイラとともに供給されているライブラリアンを使って，練習 
問題 1-1 で書いた，人力と出力のルーチンを含むライブラリをつくりなさ 
い. main () を含むモジュールを，ライブラリとリンクして完全なプログ 
ラムにしなさい. 

1-3 練習問題1-1， 1-2 のすべてを行う makefile を書きなさい.それから ， make 


訳注2:指定した ファイルのファイル 更新日時を現在の日時に変えるコマンド 
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を使って実行しなさい. 

1-4 読者のソース.ファイルを lint に通しなさい.どんな出力が生成されるか？ 
ソース•ファイルに2，3のエラー（使用していない変数を宣言したリ，型 
と個数を間違ったサブルーチンを呼ぶ）を加えて，再び lint に通しなさい. 
lint は何をするか？ 

1-5 C プログラム中に非静的なグローバル変数の宣言を探す grep のコマンドを 

書きなさい.つまり， grep は 

i n t Jack ; 

long Jill ; 

char * hiL L [ 2 0]; 

を探す.しかし 

i n t Alice ( ) /* no ; * / 

int Humpty (); 

static int Tweedledum; 
extern Long Tweedledee(); 

は探さない. 



2 2 進数演算 


この章では，初歩的な2進数演算と，数を計算機内で表すやり方によって起こ 
る，読者が出合う問題を探る.途中， C の演算子について述べる. 

2.1 基数と指数 

たいていの場合，2進数システムでの演算は，10進数システムでの演算と同じ 
ように行われる.このことをしっかりと覚えておけば，多くの潜在的な混乱を避 
けられるだろう.どんな基数の数でも，その数内の位置が，実際の値を決定する 
各桁の和からできていることを，小学校3年生で覚えたかもしれない（本章で 
は，小学校3年生の計算について多く述べるつもりはない）.さらに，どの桁の数 
字も，その数の基数と同じでも大きくもない•例えば，8進数（基数は 8) のすベ 
ての桁の数字は0から7の範囲である. 2進数（基数は 2) は，0または1からで 
きている.基数が，16の数は9より大きな値の桁のために特別な記号を必要とす 
る （ A — F が使われる）. 

数全体の値は，桁の位置によって決まる指数の回数だけ，基数を乗じた各桁の 
値の和である.10進数418は実際には 

400 +10+8 


の和である.別の表現では 

(4 * 10 2 ) + ( 1 * 10 丨 ）+ (8 * 10°) 

の和である （ C 言語では， * は乗算を意味する）. 2進数（基数は 2) は，各桁を 

計算するのに，10の指数ではなく 2の指数が使われること以外は，10進数と同様 
である.例えば，2進数1101は 
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16進: 


0x16 
0x17 
0x18 
0x19 
0x1 a 
0x1b 
0x1c 
Oxld 
0 x 1 e 
Oxlf 


16 進: 


10 進: 


2進： 

10000 

10001 

10010 

10011 

10100 

10101 

10110 

10111 

11000 

11001 

11010 

11011 

11100 

11101 

11110 

11111 


2進： 

00000 
00001 
00010 
00011 
00100 
00101 
00110 
00111 
01000 
01001 
01010 
01011 
01100 
01101 
01110 
01111 


図2 • 110進数と2進数 


2° = 

1 

V = 

128 

214 = 

16,384 

2' = 

2 

2 8 = 

256 

215 = 

32,768 

2 2 = 

4 

2 9 = 

512 

216 = 

65,536 

2 3 = 

8 

2 '〇 = 

1,024 

2' 7 = 

131,072 

2 4 = 

16 

2" = 

2,048 

218 = 

262,144 

2 5 = 

32 

2,2 = 

4,096 

219 = 

524,288 

2 6 = 

6A 

213 = 

8,192 

220 = 

1,048,576 



図 

2-2 2 の累乗 
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の値である. 


10進数（基数 10) 
数：1985 


2進数（基数 2) 
数：1010 


0 12 3 4 5 

X X X X X X 
0 0 0 0 0 0 


0123456789 ab cd ef 
xxxxxxxxxxxxxxxx 
0000000000000000 


0123456789012345 

111111 


i 0123456701234567 
2222222233333333 
8 0000000000000000 


進 

0 


6 7 8 9 
1111 


012345678901 

222222222233 


数 


図 


塗 0123456701234 56^ 
边 0000000011- 


0000000000 


111111 
0 0 0 0 0 0 


2 2 2 2 
★★*★ 
1010 

II 一一 II II 

8 4 2 1 
★ ★★* 
1010 


0 0 0 0 

**★★ 

19 8 5 

II II II II 

〇 

〇 〇 

〇 〇 〇 












=(10 * 4096) = 40960 
=( 6 * 256)=1536 
=(15 * 16) = 240 
=( 2 * 1 ) 2 


III 
111 
a 6 f 2 


42738 


II - 

111 

111 

1010 


0 
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2 進と 10 進の間の違いは，各桁にかけられる乗数だけである.この処理は，図 
2.1 に書かれている. 2の指数は，図 2.2 に書かれている.文字 K ( kilo の意味) 
は，2 10 を表すのに使われている （10 K バイ I 、 =10* 1024=10240バイト）. 

厳密にいえば，16進数（しばしば hex と呼ばれる）と，8進数 （ octal ) は，それ 
ぞれ基数が16と8の数であるけれども，実際は2進数演算のことについて述べる 
ときに簡略形として使われている. C 言語では，まえに Ox がついているすべての 
数は16進数である. 8進数は 0( x はない）を前に付けている.図 2.3 は10進， 

2進，8進，16進数間の相対表である. 

2.2 基数変換 

16進数と8進数は，異なるやリ方で2進数を分割して簡単につくられる. 8進 
数は，3桁の2進数からつくられる.例えば 

10110011=10,110,011= 0263 ( 8 進数） 

2進数10は8進数で2 
2進数110は8進数で6 
2進数011は8進数で3 

である.この処理は，4桁のグループが使われること以外，16進数でも同じであ 
る.すなわち 

10110011=1011, 0011= 0 xb 3 (16 進数） 

2進数1011は16進数で b 
2進数0011は16進数で3 

である. 

2進数から10進数への変換は，各桁に2をその桁の指数回かけ，それぞれの桁 
の結果を合計してできる.16進数から10進数への変換は，その桁の指数回16を 
かけること以外同じである.この処理を図 2.4 に表す. 


飞 .r | I 〇 

6 6 6 6 
1111 


II 
I — 


図 2.4 2進数/16進数から10進数への変換 












32 


2.2 進数 演算 


10進数から2進数への変換はもっと難しい.変換には2つの方法がある.どち 
らも有効ではあるが，適用が異なる. methodl は，変換された数をスクリーンに 
書いたり，配列に入れたりするルーチンにはよい. method 2 はそのほかに適用す 
るのによい.どちらのアルゴリズムでも，2進数の各桁は次のように表す. 

D 15, DU , …， D 1 , D 0. 

D 15 は最上位ビットであり， D 0 は最下位ビットである. 

Method 1: 

(1) D 15 = Number / 2 15 

(2) D 14 = (1) の除算の余り/ 2 14 

(3) D 13 = (2) の除算の余り/ 2 13 

( A ) D 0 まで繰り返す. 

Method 2 : 

(1) number が奇数ならば D 0=1， 偶数ならば D 0=0 

(3) number が奇数ならば Dl = l : 偶数ならば D 1=0 

( A ) number = number /2 ; 

(5) D 15 まで繰り返す. 

この アルゴリズムで， number は変換すべき数， / は整数除算である.商の小数 
部分は切り捨てる.つまり，1/4=0 (1/4=0.25 であるが，小数 0.25 は切り捨てる） 
である. 5/2=2 (5/2=2.5であるが， 0.5 は切り捨てる）である.余りは，除数の 
点から表される商の分数部分である.つまり，7/5=1+ 2/5であれば，1は整数の 
商で，余りは2 (2/5 より）である.別の例では，17/6=2 + 5/6 (2 が商で，5が余 
り）である.剰余演算子（しばしば MOD と略される）は整数わり算の余りを生ず 
る. C では，％が剰余演算子として使用される.すなわち，17/6=2，17%6=5 
である. 


2.3 加算と減算 


前に述べたように，2進数演算は10進数演算と同様に行われる.10進数は次の 
ように加算される. 

(0) 右側の欄を縦にたす. 

( 1 ) 結果が9より大きかったら，次の欄へ繰り上げる. 

(2) 次の欄を，繰り上がりの数（キャリー）を含めてたす. 

( 3 ) もっとも左の欄までこの方法を続ける. 

2進数も同様に行われる. 


2.4 負 数 


0 

+ 0 
00 




01 
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0+0は0でキャリーは0, 0+1は1でキャリーは0，1+1は〇でキャリーは1， 
そして，1 + 1 + 1は1でキャリーは1である. 2つのもっと実際的な加算の例を 
図 2*5 に示す.減算をするには，ひとつの数を負の数にして加えなさい. 


1 1 


キャリー： 111111 


00101001 

= 41 

00101111 

= 47 

+00100101 

= 37 

+00011101 

= 29 

01001110 

78 

01001100 

76 


図 2 . 5 

1加算 



C 言語で加算が行われるとき，最上位ビットからのキャリーは捨てられる.こ 
れは問題を起こすこともある.例えば，8ビットの符号なしの数255は char の大 
きさの変数 ( Oxff の値を持つ）に格納される.しかし 

uns 1 gnea char x ; 

x = 255; 
z = x + 1; 

は加算の結果 0 になる.次の2進数演算をみれば理由がわかるだろう. 

彳 < リー ：1 mi ill 

11111111= 255 
+ 0000 0001 = 1 

10000 0000 0 

もっとも左のビットは，8ビットに収まらないので，捨てられる. 

2.4 負 数 

負数の概念は，10進数システムでだけ意味を持っている.負の10進数を表す 
ために2進数，16進数，8進数を使うことができる.しかし，2進数自身に負の 
数はない.すなわち， 0 xla 2 は10進数で418であるけれども， 一0 xla 2 は意味が 
ない. 0 xfe 5 e は16ビットの計算機で10進数の一418を表している.負の数は， 
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たいていの計算機では，2の補数として知られる方法で表されている.負の2の 
補数をつくるには，正の数のすべてのビットを反転させ （ 1は〇に，0は1にかえ 
る），その結果に1を加える.その過程を図 2.6 に示している. 


1 = 00000001 


反転： 11111110 

加算1: + 00000001 


- 1 =11111111 


27 = 00011011 

11100100 
+ 00000001 

-27 二11100101 

図 2*6 負数の形成 


88 = 01011000 

10100111 
+ 00000001 

-88 =10101000 


2の補数には，いくつか面白い特質がある.負数を打ち消して正数にかえるこ 
とができる.もっと重要なことは，さまざまな算術演算がすべてできることであ 
る（つまり，負数と正数をたしたり，ひいたりして正しい符号の結果を得ること 
ができる.正数に負数をかけて負数を得る，などができる）. 

負数のもっとも左のビットは，常に1であることも重要である （ 正数では常に 
0である）.このために，2進数のいちばん上のビットは，符号ビット （sign bit ) 
と呼ばれる.符号ビットのために， ハグがいくつか 現れることもある.次は8ビッ 
卜計算機での例である. 

キャリー：11 


00101000 = 

40 

+ 01100100 = 

100 

10001100 = 

-116 


1 ——上位ビットが1，それで 
数は負数である. 

これは期待していたものではない. 8ビットではなく，16ビットを使用してい 
たならば，この エラー は起こらなかっただろう.計算は次のようになる. 

キャリー： 11 

0000000000101000 = 40 

+ 0000000001100100 =100 

0000000010001100 =140 

負数になる可能性があるときには，2進数は，計算機の十分な語長に引き伸ば 
して表されなければならない. 

負数を表す方法が及ぼした別の重要な作用は，符号拡張 （sign extentsion ) であ 
る.数がより長い型に変換される（例えば，8から16ビットへ）ときには必ず元 









2.5 シフト，乗算，除算 
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の数の符号は維持されなければならない.これは，新しく加えられた上位ビット 
に，短い数の方の符号ビットを2重にして行う. 8ビットと，16ビットで 一27 を 
考えてみよう. 


-27 = 11100101 ( 8ビット） 

-27 =1111111111100101 (16 ビット〉 

8ビットの数が拡張されるとき，短い方の最左のビットが，長い方の最左バイ 
卜の全ビットに2重化されている.下位バイトの符号ビットが上位バイトに拡張 
されている. 

符号拡張は， C プログラムに発見するのが難しいバグを生みだす.これは10章 
と本章の後半でも述べる. 

2.5 シフト，乗算，除算 
2.5.1 シフ ト 

10進数の計算では，左にシフトして10をかけることができる.すべての桁が 
ひとつ左へ移動し，もっとも右の桁には0が入れられる （60 はひとつ左にシフト 
して600になる）.同様に，10進数はひとつ右にシフトして，10でわることがで 
きる （60 はひとつ右にシフトして6になる）.この処理はどの基数にも適用でき 
る.すなわち，基数をかけるにはひとつ左に桁をシフトし，基数でわるには右に 
シフトする.計算機は2進であるから，左シフトは2の乗算，そして，右シフト 
は2の除算である. C では，演算子《と》はそれぞれ左，右シフトを表すのに使 
われる（これらをより大きい（〉）や，より小さい（く）と混同しないように注意 
すべきである）. N 《2は，2進数の2桁分左にシフトした （4 をかけた） N と等し 
く， N 》 X は， X ビット右へシフトした （2 X で割った） N と等しい.ここで，《 
や》は演算数を更新しないことに注意しなさい（+， 一 やその他の演算子がする 
以上に）.上の例で実際に N を更新するためには，記号=が必要である（言いか 
えれば， N <<=2,または ，N = N 《2とする必要がある）.数が左にシフトされる 
ときには，最下位ビットには0が入れられる.右シフトでは，上位ビットは通常 
2重化される（シフトされた数の符号を維持するため）.例えば，8ビットの2進 
数10001101を，左に1ビットシフトすると00011010になる.10001101 
を1ビット右にシフトすると11000110になる.理論上は，右シフトの符号拡 
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張は認められない.しかし，たいてい， どのコンパイラ でもそれを行っている. 

2.5.2 乗 算 

経験では，計算機はかなリ馬鹿であると言える.たいていの計算機は，根本的 
に加算機を実際以上によくみせている.計算機ができることのすべては簡単な計 
算と メモリ のやりとりである•いくつかの計算機 （8080/ Z -80 ファミリはこの中に 
入る）は，乗算ができない.しかし，古い型の加算機のようなものは，加算と 
シフトができる. 2つの数は，一方の数字自身を何回か加算することで，かけ算 
される.実際には ， X + X + X を使う方が X *3 よりもはやくできることがある. 
コンパイラの 中には，演算数が十分小さいときに，乗算を行うのに加算を繰り返 
し（または，加算とシフトを組み合わせて）生成するものがある.しかし，いっ 
たん乗数がワード幅よりも大きくなると，連続した加算はかなり遅くなる.やり 
たいことが2をかけたいだけならば，数をシフトするだけでよいだろう （ 乗算や 
除算をするよりも，使えるのならばシフトをするほうが通常はずっと効率がよい）. 
2以外をかけるには，もう少し複雑になる. 2つの数の乗算には，たぶん， 次の 
ような アルゴリ ズムを使っている. 

( 〇 ) かけられる数は被乗数である.被乗数にかける数は乗数である.かけ算の 
結果は積である（式 2*3=6 では，2が被乗数であり，3が乗数で，6が積 
である）. 

( 1 ) 被乗数に，乗数の最右の桁をかける.すると部分積ができる. 

(2) 被乗数に，乗数の次の桁（前のステップの桁の左となりの桁）をかける. 
かけ算の結果を，左へ1桁シフトして，ステップ1の部分積に加える. 

( 3 ) 乗数全体が終わるまでこの方法を続ける. 

この処理は，次のようにもっときちんと書くことができる. 

( 〇 ) 最下位の桁を0にする.最上位の桁を1にする. 

( 1 ) N =0，積 =0. 

(2) 乗数が0に等しいならば，終わり. 

(3) 被乗数に，乗数のもっとも右の桁をかける.このかけ算の結果を N 桁左へ 
シフトして，その結果を積にたす. 

(4) 乗数を1桁右へシフトし，もっとも右の桁を捨てる. 

(5) N = N + 1 
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00110 = 6 
01010 =10 


(0110 * 0 が左に〇ビッ 

(0110 * 1 が左に1ピノ 

(0110 * 0 が左に2ビッ 

(0110 * 1 が左に3ビッ 


00000 

00110 

00000 

00110 


00111100 = 60 


( 4つの部分 f 貴の手卩 ）！• 4 partial prod 

図2 • 7 2進数かけ算 


好きずきだが，部分積を全部を1度にたすのではなく，2つずつたすこともで 
きる. 


00000 
+ 00110 


001100 

00000 


0001100 

00110 


00111100 


(第1の部分積） 

(第2の部分積） 

(第1+第 2) 

(第3の部分積） 

(第1+第2+第 3) 

(第4の部分積） 

(第1+第2+第3+第4: 


符号拡張は，2進数の乗算でも問題である.部分積が負なら，その積を十分な 
ワード幅に （8 ビットどうしをかけているときは16ビットに）符号拡張しなけれ 
ばならない.この状態を図 2*8 に表している. 

ここで，結果は8ビットに切り詰めなければならないことに注意すべきである. 
切り詰めなかったら，結果は0111101110 = 494になってしまう.また，この 
方法では計算のために負の演算数が上になければならない（さもないと符号拡張 
は行われな いだろう）. 乗算の アルゴリズムには， 被乗数と乗数をどちらも正にし 
てかけ，後から積の符号を合わせることで符号披張の問題を回避しているものもあ 
る.他にも，もっと優れたよい方法があるが，それはこの本の範囲を越えている. 


( 6 ) ステップ2へ行く. 

この アルゴリズムは， 2進数のかけ算でも使用できる.ただ，桁をビットにか 
えれば よい.このアルゴリズムの 問題点は，再帰的に定義されることである. ア 
ルゴリズムは， かけ算の仕方を教えているけれども， いつも 1か〇だけをかけて 
いる.この程度の低いかけ算は，まったく本当のかけ算ではない.むしろ，数を 
ある位置か ら 別の位置へ動かすかどうか，あるい は 数よりも0を動かすかどうか 
判断している. 2進数のかけ算の過程を図 2.7 に表している. 


たたたた 
れれれれ 
ささささ 
トト L — r 

フフフフ 
シシシシ 
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2つの4ビットの数のかけ算，ひとつは負数，8ビットの結果になる. 
部分積の最右の4ビット以外はすべて符号拡張. 

1010 = -6 
0011= 3 


111111010 
11111010 
0 0000000 
00 000000 


11101110 = -18 

図2_8異なる符号を持った数のかけ算 


2.5.3 除 算 

2進数の除算も，10進数の計算を手本にしている.それで，まず10進数での処 
理をみることは価値がある.次の問題を考えてみなさい. 

__014- く--商 

除数 --> 11〉156 <- 被除数 


46 

44 

2 く-余り 

長いわり算の処理は，次のように記述することができる. 

(0) 式 A/B = C では， A は被除数， B は除数， C は商である. 

( 1 ) 1 (156 の最左の桁）を11 ( 除数）でわってみる.わることはできない.それ 
で，商に0をおく. 

(2) 15(156 の左から2桁）を11でわってみる.1回われる.それで，商に1 
をおき，15から11をひき，4がでる.被除数から6をおろしてきて，46に 
する. 

(3) 46を11でわってみる. 4回われる.それで，商に4をおいて46から44 
(4*11) をひき，2がでる. 

(4) もうおろしてくる桁がない.それで，処理は終わり.余りは2である. 

このアルゴリズムには，いくつか 問題がある.大事なことは，作業自体がとて 

も複雑であることに気付くことである.普通の状態では，先頭に0があることは 
考えない. 2進数では考えなければならない被除数が，除数に対応して，いつも 
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おき直されなければならないことに注意すべきである.さらに，被除数自身が， 
アルゴリズムの 進行につれてかわっている（ひき算をするとき，実際には新しい 
被除数をつくりだしている）.最後に，全体の被除数をみていないことに注意すベ 
きである.つまり，被除数の小さな部分をみているだけである. 

ここで，2進数の例をみてみよう.次はよく慣れた形でわり算を表している. 


110 ) 100010 (3 A / 6 = 5) 

110 


101 

000 


1010 

110 

100 余り= 4 

余リからはいつも0か除数をひいていることに注意すべきである.また，4桁 
の被除数以外は，みていないことにも注意しなさい. 

除数を右にシフトするよりも，被除数を左にシフトするほうが簡単であること 
がわかる.被除数全体を操作していない，むしろ，被除数を4ビットのウィンド 
ウにして操作している.アルゴリズムは，進行につれてそのウィンドウを通して 
被除数をシフトしている.ウィンドウから（左に）押しだされた桁は捨てられる. 
ウィンドウは0ビットに初期化され，被除数の上位3ビットが続く. 

この アルゴリズムは， 2 N ビットの被除数を N ビットの除数でわって， N ビッ 
卜幅の商をつくる.ウィンドウは，被除数の上位4ビットからつくられた N +1 
ビット幅の内容である.除数と被除数は，どちらも符号なしの数であると仮定し 
ている.わり算は次のように行われる. 


( 1> if (除数 <=ウィンドウの内容） 

商はオーバー フロー する （ N ビットより大きくなる）. 

*** ERROR *** 

(2) N 回繰り返す： 

i 

If (商 <=ウィンドウの内容） 

ウィンドウ =ウィンドウ- 除数； 

商の最右ビット = 1; 

> 

被除数と商を左に1ビットシフトする 


(3) 


If (除数 <=ウィンドウの内容） 
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ウィンドウ=ウィンドウ-除数； 

商の最右ビット=1; 

> 

(4) STOP : ウィンドウは余りと商を保持している. 

具体的な例をみれば，このさきは理解するのがもっと簡単である. 6ビットの 
数 （100010=34) を3ビットの数 （110=6) でわり，3ビットの商 （101 = 5) と3 
ビットの余り （100=4) をだす. 4つはすべて符号なしである（先頭の1は負数を 
示すものではない）.ウィンドウは被除数の一部を囲む箱として示されている.こ 
の箱の左にある桁は捨てられる. 

初期値： 

000 商=0 

0100 010被除数=34 
110 除数=6 

ステップ1: 

除数> ウィンドウの内容；オーバーフローなし 
ステップ2 (反復 1) : 

除数〉ウィンドウの内容：ひき算をしない. 

しかし，被除数と商を左にシフトする. 

000 商 

0100010 被除数 


110 除数 

ステップ2 (反復 2) : 

除数 < =ウィンドウの内容：ウィンドウの内容か 
ら除数をひいて結果をウィンドウにおく. 
(1000—110=0010). 商の下位ビットに1をおく. 
商と被除数を1ビット左にシフトする. 



ひき算 

001 


••そして••… 

商 


シフト 

010 

0 

0010 

10 

被除数 

00 

0101 


110 


除数 


110 


ステップ2 (反復 3) : 

除数>ウインドウ：ひき算しない. 
しかし，商と被除数を左にシフトする. 
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100 商 


0001010 被除数 

110 除数 

ステップ3:除数< =ウィンドウの内容； 
ひき算をして，結果をウィンドウにおく. 
( 1010 - 110 = 0100 ). 

商の最下位ビット=1; 

(シフトしない）. 

101 商 


0010100 被除数 


110 除数 


ステップ4:終わり，ウィンドウは余りを保持して 
いる (0100=4). 商は 101=5. 


2.5.4 切捨て， オーバーフロー， 速度 

乗算と除算に関係するおもな問題は，結果の正確さである.数を右へシフトす 
ると，もっとも右にあった桁は切り捨てられる.続いて左にシフトしても元にも 
どらない.結果として，わり算（右シフト）にかけ算（左シフト）を続けると正確 
ではなくなる（わり算のとき大事な桁をいくつか切り捨ててしまうから）.もしか 
け算をさきにすれば，正確さは失われないだろう.しかし，計算機のワード幅を 
オーバ— フローするかもしれない（結果は有効なビットで表せる大きさを越えて 
いるかもしれない）.もちろん，積のワード幅が乗数や被乗数の2倍ならば，オー 
バ_ フロ—の問題はないだろう.しかし，これがいつもできるとは限らない（例 
えば，2つの double の数をかけなければならないときなど）. 

関連した問題がいくつかある.例えば， 一1/4 は0ではなく _1になる.ここで 
は， 一 1は値 Oxffff である. 4でのわり算は右シフトを行う.しかし，上位ビッ 
卜はシフトの一部として拡張された符号である.つまり， 一4/1 はなにもしない 
( Oxffff は2ビット右にシフトされても Oxffff である）.問題によっては，使われ 
ているわり算アルゴリズムのため思わぬ結果になる.ウィンドウ.レジスタは演 
算数とはサイズが違うから，数の上位ビットが誤って切り捨てられることもある. 
例えば，49152/ — I は16384となる.同じ数を16進数の表現でみると理由がわか 
る.すなわち， OxcOOO / —l = =0 x 4000 である.上位ビットは誤って切り捨てら 
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れている. 

切捨てとオーバー フローの 問題は，特に浮動小数演算で目立つ.そこでは，わ 
り算とかけ算を間違った順序で行うと，正確さを失う.要は，オーバーフローの 
問題を心配しなければならないのはプログラマである . C 言語にはオーバー フロー 
を処理する用意はない.どのような演算（加算や減算を含めて）を行う前にも， 

2つの演算数が範囲内にあるかチェックするのはプログラマの義務である. 

かけ算とわり算のもうひとつの問題は，速度である.かけ算とわり算は演算に 
時間がかかる（シフトなどに比べて，時には，連続したたし算やひき算に比べて 
も）.浮動小数演算は整数演算に比べてもっと時間がかかる.効率が重要ならば， 
計算についてよく考える必要がある.かけ算やわリ算を最小限にする アル ゴ リズ 
ムを開発することは価値がある. 

別の問題は，型変換に時間がかかることと，式の評価でしばしば暗黙の型変換 
を行うことである.例えば， char を含む式は， int だけを含む式の値を求めるよ 
りも時間がかかる.自動型変換のルールは，すべての char を int にかえてしまう 
からである.同じ自動型変換のルールは， float と double にも適用される.つまり， 
すべての float は，計算される前に， double に変換される.その結果， double の 
2数より： float の2数で同じ演算をするほうが（たとえ， float の方が短くても） 
時間がかかる.原則は，数を格納するのなら char よりも int に， float よりも 
double を使う. char に変数をおくことでメモリを節約しても，型変換をする余 
計なコードで相殺される. float と double を使うことでメモリの節約は実現する 
かもしれないが， float を使うと速度の問題が起こる.速度が重要ならば，最悪の 
場合の型にすべての数を格納することで型変換を最小限にする.いくつかの演算 
数が double ならば，（たとえ結果が整数になるとしても）すべて double に格納す 
る. C は次々に生成される口ーカル変数を再利用するから，最悪の場合でもメモ 
リは浪費されない （4 章で，この再利用がどのように行われているかをみる）. 

2.6 ブール代数 

2.6.1 論理演算子 

C 言語はさまざまな論理演算子をサポートしている.そのうちのもっとも単純 
なものは，比較演算子である. A と B がどの式にもあるとき 
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A > B は A が B より大きければ真である. 

A < B は A が B より小さければ真である. 

A >= B は A が B より大きいか等しければ真である. 

A <= B は A が B より小さいか等しければ真である. 

A == B は A が B に等しければ真である. 

A ! = B は A が B に等しくなければ真である. 


“等しい”が2重の等号 （ = = ) であることに注意すべきである.等号ひとつのと 
きは代入 （ a = b は b の内容を a に入れて， b の内容を評価する）を表す.この2つ 
を混同しないように注意しなさい. 

C 言語では，数0は偽を示し，0でない数（負数も含む）は真を示す.論理演算 
子は，式の評価を数にして（真なら1,偽なら0)，他の演算子と同じように作用 
する.式 

X + (A > B ) 

はまったく正当で問題ない. A が B よリ大きければ （X + 1) に評価され， A が B 
より大きくなければ （ X +0) に評価される . C には3つのブール論理演算子， 
AND (&&), OR ( | I ), NOT ( !) がある • & と I が2重になっている.それ 
で，ビットごとの AND 演算子&やビットごとの OR 演算子 I と混同しないよう 
に注意すること. AND , OR , NOT は次の真理値表を使用する. 


NOT ! 


AND 

&& 



OR 

1 

1 

A | ! A 

A 

| B 

1 A 

&& B 

A 

| B 

1 

A II 

F !1 

F 

•1-— 
| F 

I--' 

1 

0 

F 

•1--- 
| F 

-I- 

1 

0 

T | 0 

F 

| T 

1 

0 

F 

| T 

1 

1 


T 

j F 

1 

0 

T 

| F 

1 

1 


T 

| T 

1 

1 

T 

| T 

1 

1 


T ==真 （ 〇でない） 
F ==偽 （ 0 ) 


真理値表は，かけ算表のような働きをする. A と B は式中の2数である•もっ 
とも右の欄は演算の結果を表し， A と B の規定された値を与える.真理値表のよ 
うに書かれた A の•かけ算表は次のようにみえるだろう. 


A 

| B | 

A * B 

1 

• 1 1 
| 1 | 

1 

2 

| 3 | 

6 

4 

| 5 | 

20 


2*3==6，などである.同様に， T | I F = = l ( 左側の演算数が 
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ゼロでなく，右側の演算数がゼロならば，式全体は1と評価される）. AND , OR , 
NOT の真理値表は暗記する価値がある （A && B は A と B がどちらも真のとき 
だけ真で あり， A I |8は八か3， または， A と B どちらも真のとき真であるこ 
とを覚えればよい）. 

&&と I 丨は他にない特性を持っている.&&と丨丨が使われている式中の評 
価の順序は左から右に行われることになっている（かっこで囲んで，順序をかえ 
ようとしていなければ）.そして，評価は式の真偽が決定されたとき終了すること 
になっている.それで，式 

1 f( X && spot()) 

において， X が偽 （0) ならば spot () は呼ばれない（なぜなら， X が偽だと式の評 
価は終了するから）.同様に 

i f( x || dog()) 

では， dog () は X が真 （1) ならば呼ばれない（なぜなら，サブルーチンの戻り値 
に関係なく式は真と評価されるから）. 

2.7 簡単な恒等式 

論理演算子は，よく制御ループや if に使われる.効率の点からいって，これら 
はしばしばプログラム中のもっとも危ない部分である（よく実行される部分であ 
る）から，できれば論理式を最適化することはよい考えである. C コンパイラの 
中にはいくぶん最適化するものもあるが，あてにはできない.この章では式を最 
適化するさまざまな簡単な方法を示す. 

2.7.0.1 式の反転とド.モルガンの法則 

もっとも簡単な論理演算子は， NOT (丨）である.！ A は A が偽（ゼロ）なら， 

1になる. A が真（ゼロ以外）ならば，0になる 丨と他の演算子との組合せで巧 
妙なことができる.特に 


II II II II 

! = <><> 

A A A A A A 
(((((( 


)))))) 
3 3 3 B 3 3 

II II II II 

= !><>< 

A A A A A A 
(((((( 


である.最初の 2 つが同じであることはあきらかであるが，他は少し考えを要する. 
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(A| 
C (A | 
((A | 


B ) = = ( B || A) 

B) || C) == (A || (B || C )) 

B) && C) == (A&&C ) | | (B&&C ) 


10. (A && B) 

11. A 

12 . B 


(A && !B) 

(A && B) 
(A && ! B ) 


A 

A 

(A | | B) 


(A&&B) = 

((A&&B) && C)= 
((A&&B) || C)= 

(A | | B) && (A 

A && (A 

B && (A 


(B && A) 

(A && (B && C)) 
(A| | C) && (B| |C] 


!B) == A 
B) == A 
!B) == (A && B) 


図 2 • 9 恒等式 
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演算子！は， AND や OR とも使われる. 

! (A && B) == ( ! A II !B) 

! (A | | B) == ( !A && !B ) 

この 2 つの恒等式は，ド•モルガンの法則として知られる.重要なことは（丨 A | I 
! B ) がコンピュータへの3つの動作を表していることである.！ A , ! B , I I は， 
別々に計算されなければならない.一方で ，！ （A && B ) は2つの動作 （&& と 
!) だけである.それで，さきのと後のでは実行時間を3分の1減らすことがで 
きる.この問題のもう一方の側面は，読みやすさである.時には，プログラム全 
体を読みやすくするために，式を非能率的のままにしておくことも価値がある. 
場合によって，代数的変形を行うかどうか決めなくてはな らない. 

2.7.0.2 ブール代数の簡単化 

ド.モルガンの法則に加えて，他にもいくつか役立つ恒等式がある.よく使わ 
れるものを図 2*9 に示す. 


)) ) \/ 
B 1 O A A 

& & & & & 
& & & & & 

A A A A A 

/K /K /V /V ( 


\/ \/ \/ ) \y 
B o1 A A 


〔 A A A A 


2.8.1 AND , OR , XOR , NOT 

通常の論理演算子に加えて， C 言語はいくつかビットごとの演算子をサポート 
している.ビットごとの演算子は，通常の演算子と同じ真理値表を使用する.し 
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AND 


OR 


1 & 1 
1 & 0 
0 & 1 
0 & 0 


I-1 

||-0 

III - 〇 

INI I 

1100_I 

1010 _ 


1110 


X 0 R 


1000 


かし，1度に1ビット（または，1カラム）ずつを対象に演算する.例えば，数101 
と011のビットごとの AND をすると，最右のビットどうしを AND して答えの最 
右のビットに結果 （ 1 AND 1==1 ) をセットする.まん中の2つのビットの AND 
をとって，答えの中央のビットに結果 （0 AND 1==0)をセットする.最左のビッ 
卜も同じように処理する.いくつかの例を図 2*10 に示す. 

C には，4つのビットごとの演算子，& ( AND )， | ( OR ), 〜 （ NOT )， ^ ( XOR ) 
がある.ビットごとの AND とビットごとの OR は，通常の AND (&&) と OR 
( I 丨）とは違い，ひとつの&と I が使われている.これらの演算子は，かなり 
違う動作をするので混同してはならない.ビットごとの NOT (〜）は演算数の全 
ビットを反転させて （1 を0に，0を1にする）評価する.しかし，演算数自身は 
かわらない（演算数が0でないとき0に，0のとき1に評価する論理演算子の NOT 
とは混同しないこと）.演算子 XOR (排他的 OR ) は次の真理値表に従って結果を 
出す. 

A | B | A A B 

— 1 -—I - 

0 | 0 | 0 

0 | 1 | 1 

1 | 0 | 1 

1 | 1 | 0 



画 Io o 

I I o1 
I - 1o 


0110 _ 

図 2 .10 ビットごとの演算 































2.8 ビットごとの演算子とマスク 
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排他的 OR は，対応するビットが異なる桁を真とする演算子である.演算数が 
異なれば結果は1になる.つまり，どれか一方だけが真ならば結果は真になる. 

2.8.2 マスク 

ビットごとの演算子の，興味深い特質が図2.10ではあきらかである.下にある 

演算数は，答えを導くために，上にある演算数が処理されるフィルタのようにみ 

える.この下になっている演算数はマスクと呼ばれる. AND 演算をみると，マ 

スクに1があるところは，上にある演算数がそのまま答えまで通過している•マ 

スクに0があるところは，答えは0になっている. AND マスクはビットを選んで. 

クリアしたり （0 にセットしたり），あるビットだけを調べるのに使われる.例え 

ば，式 c=c & 0 x 7 f は変数 c の下位7ビット以外をクリアする（これは，特に人 

力文字から パリティ ビットを除くのに有効である）.式では 

if ( A & 0 x 03 ) 

do _ something () ; 

と表す . do _ something は A の下位2ビットがセットされているときだけ実行され 

る. 

OR マスクも同じような働きをする.しかし，マスクで0になっているビット 
のところだけ，上の演算数が変更されないで答えまで通過する. OR マスクに1 
があると，答えの対応するビットはセットされる （1 になる）. OR マスクは，ビッ 
卜を個別にセットするのに使われる.例えば， x=x I 1は x の最下位ビットを1 
にする. 

最後に， XOR マスクはビットを選んで反転させるのに使われる. XOR マスク 
で 1 があるところは，上の 演算 数の 対応す るビットだけが答えでは反転される （1 
が0にされ，0が1にされる）. XOR マスクは，ビットマップド•デ ィス プレイの 
ひとつのビットを反転させたいときなど，グラフィック•アプリケーシヨンに有 
効である.また，ハードウエアのレジスタ中のひとつのビットを反転させるとき 
にも使える（いいかえれば，ひとつを除いてレジスタの全ビットが，エラーのと 
きは1に，成功のときは0にセットされる.その時，除かれたひとつのビットは， 
他のビットとは反対になっている. XOR マスクは，その正反対のビットを反転し 
て，成功のときはレジスタ全体が0であるとしてテストすることができる）. 
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2.9 コンマ，等号，条件演算子 

C 言語でサポートされている演算子のうち2つは，解説をつけるに値するほど 
かわっている.それは，コンマ （ ， ） と条件演算子 （ ？： ） である.さらに代入演 
算子 （=) は，たいていの言語にあるものとは異なる扱いをされている. 

まず，相当 （ = = ) と代入 （=) を混同しないように注意する•式 

x == y 

は， x や y を変更しない.式は， x と y が等しければ1になり， x と y が等しくな 
ければ0になる.文 

x = y 

は x を y の内容に変更する.この2番目の式は，代入が行われた後の x の内容に 
評価される. 

二:= や = の演算子と式を使って，何かを評価することに気がつくことは重要で 
ある（すべての式は何かを評価する）.代入演算子は，他の演算子のように演算子 
のひとつである.そして，やはり他の演算子と同じく，算術式の一部になること 
ができる.例えば 

x = 5 + (y = z ) ; 

は，完全に正しい文である. z の内容が y にコピーされる（かっこ内の式は，代 
人後 y の内容に評価される）.それから， y の内容が5に加えられて，結果が又に 
おかれる.=の優先順位が低いことに注意する.式 

x = a + b = z + 5 ; 

には，かっこが暗示されている.すなわち 

x = (a + b ) = (z + 5 ) ; 

である.式に値を代入できないから，コンパイラはこれをみつけたらエラー•メ 
ツ セージを 出すであろう. 

コンマは， C 言語の多くの記号と同様に，その文脈に依存するさまざまな機能 
を持っている.関数の引数どうしを分けることにも，ひとつの演算子としても使 
用される.この使い方を混同しないことが大切である.関数の引数並びにあるコ 
ンマは 算術演算子ではない. コンマ 演算子の主な目的は， for 文で複数の式を書 
かせることである.例えば 

T or( 1= 0, j = size ; i <= j ; i ++, j--) 


2.9 コンマ，等号，条件演算子 
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のループでは， i と j が for 文の左の部分で初期化され，どちらも右の部分で更 
新されている. 

for ループの目的は，1ヶ所にループの制御を集中させることであるから ， for 

文の中にループ制御を処理する変数を持たない演算を含んでいるのは，悪い書き 

方だと考えられる.コンマ演算子は，このようによく乱用される.つまリ，そこ 

にあるべき仕事を持たない式を for 文において使う（なぜなら，ループの制御を扱 

う変数を持たないから）.例えば 

for ( x += 7 , y =1 ; y < 10; y + + ) 
body (); 

では， X を含んでいる文は，制御に使われていないから，ループには属さない. 
この文は次のように書き直されるべきである. 

x += 7 ; 

f 〇 r ( y =1 ; y < 10; y + + ) 

body () 

コンマ演算子は，実際にはどんな式にも使うことのできる演算子である.コン 
マ演算子を，代人をしない，代入演算子としてみることができる.つまり，式 

x = ((y +=1 ) , (z +=1 )) ; 

は， x と y はどちらも1増加する.文は，代人演算子 （=) に類以したやり方で， 
コンマの右にある式の内容に評価される.つまり，（増加後の） z の値が x に加え 
られる.ここで，優先順位に注意すべきである.コンマはどの演算子（代入演算 
子も含む）よリも低い優先度を持つ.例えば 

x = ( 1, 2 ) ; 

はコンマ演算子で2に評価される.式 

X = 1, 2; 

は1に評価される.しかし，コンパイラのかっこ付けは次のようになる. 

(x = 1) , 2; 

コンマ演算子は，場合によってはマクロに役立つ.しかし，それは読みにくい 

ので避けるべきである.前述の式は次のように書かれるべきである. 

z += 1 ; 
x = (y +=1 ) ; 


3番目の興味深い演算子は条件演算子 （ ？： ） である.条件演算子は3項演算子 
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である.すなわち，2つではなく，3つの部分を持つ. 

x + y 

は2項演算子が2つの部分を持ち，ひとつの結果（和）に評価される. 3項演算子 

x ? y : z 

は3つの部分を持つ.しかし，やはリひとつの結果に評価される. x が真ならば 
y に評価され， x が偽ならば z に評価される.次のように，どちらの項もサブルー 
チンであるとする. 

x ? sam ( ) : dave () 

この時は，どちらか一方のサブルーチンだけが呼ばれる.条件式は，ひとつの 
演算子である.それで，次の式にも使われる. 

a = x ? y : z ; 

この式は， x の真偽によって， y か z の内容を a に代入する.この例では，条件 
式を等価の 


にするほうが好ましい.なぜなら，条件式から生成されたコードが，もっと効率 
的である（アドレスが，2度でなく1度計算されるだけでよい）. 

条件式は，他のところにも使用できる.例えば 

printf ( "x is % s ", x ? " TRUE " : " FALSE "); 

は， X がゼロでなければ“ X is TRUE ” を書き， X がゼロならば“ X is FALSE ” 
を書く.ここで，条件式は文字列のどちらか一方に評価される.等価のコード 

1 f ( X ) 

p r 1 n t f ( "x is TRUE "); 

else 

p r i n t f ( "x is FALSE "); 


は，かえって効率的でない.ここでは2つの文字列に多くの文字を格納する必要 
がある.さらに重要なことは，サブルーチンを呼ぶプログラムをひとつでなく 2 
つつくる必要がある. 

条件演算子は人れ子にすることもできる.例えば 

//define YES 0 

^define NO 1 

//define MAYBE 2 


2.10 バ 


グ 
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p r 1 n t f("x = % s " # x == YES ? " YES " : 

x == NO ? " NO " : 

"MAYBE ); 

評価の順序をあきらかにするために，入れ子になった条件式を上のように書くこ 
とは大切である. 

pnntfC'x = % s ", x == YES ? " YES " : x == NO ? " NO " : " MAYBE " )• 

はさきの例よリも言壳みにくい. 

2.10 バ グ 

予想しない符号の拡張や，数の切捨ての結果，浮かび上がってくるバグがいく 
つかある.例えば， char はたいていのコンパイラでは符号付きの数である（しか 
し ， unsigned char として宣言できる）.すべての ASCII 文字は，数の下位7ビ 
ットで表される.しかし，計算機の中には特殊なキーを8ビットで表しているも 
のもある （ IBM - PC のように）.例えば， IBM のキーボード上の補助キーをたた 
くと， ROM - BIOS は2バイトコードをソフトウェアに渡す.最初のバイトはい 
つも0で，第2 ノ'^卜は ASCCI コードではない特殊なコードである1バイト人力の 
ルーチンに2バイトかえってくると不都合であるから，第2バイトはしばしば， 
特殊なコードであることを示すために，最上位ビットを1にセットしてかえされ 
る. F 1 キーをたたくと，2文字シーケンス 0 x 00 0 x 3 b (2 進数では00000000 
001110 11) を送り，それから Oxbb (10111011)にマップされる. 

このマッピングは，次のサブルーチン getkb () で行われる. getkb () は，ハー 
ドウェアから1文字得るために scan () をよび，2文字シーケンスを1文字にマッ 
プする. 

getkb () 

て 

char x ; 

1 f ( (x = s can ( )) == 0 ) 

x = s c an ( ) | 0 x 80 ; 

return x ; 

> 


getkb () は，ほとんどの文字入カルーチンが行うように， int をかえす.どの式 
でも， char の変数はすべて式が評価される前に i n t に変換される.予約語 return 
は，式を引数とする.それで， x は式であるかのように扱われ，型変換が行われ 
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る • x が Oxbb を含んでいるとすると，この数は， char が int に変換されるとき， 
Oxbb が Oxffbb に変換される （ Oxbb は負数である.符号拡張が行われて Oxffbb 
になる）.したがって 

if ( ge tkb ( ) = = Oxbb ) 

でテストしてもうまくいかない.なぜなら， Oxbb でなく Oxffbb が getkb () から 
かえされる.この問題は，次のように言丁正することができる. 

i f ( (ge t k b ( ) & 0 x f f ) = = Oxbb ) 

または ， get kb () の中で 

return ( x & Oxff ); 

としても動くだろう. AND 演算が行われる前に x が int に変換されるだけである. 

関連した問題が，通信を行うハードウヱアとのインタフェースにある.このハー 
ドウェアの大部分が，パリティ•チヱックと呼ばれる エラー 検知機構をサポート 
している.偶数パリティが使われていれば，すべての文字は，偶数個のビットが 
1にセットされる （2 進数101は偶数個，この場合は2つビットがセットされて 
いる. 010は奇数個のビットがセットされている）. ASCII コード全部が偶数個の 
ビットが1になっているのではないから，パリティ•ビットが数を満たすために 
使われる.それで，偶数個の1のビットを持つことになる.例えば， ASCII コー 
ドの a の数値は 0 x 61 である （2 進数で0110000 1). この数は奇数個のビットが 
1である.したがって， ASCII コードの a が，偶数パリティを使用してモデムを 
通して送られるときは，最上位ビットが1にセットされ，この数は偶数個の1の 
ビットを含むだろう.つまり，数 0 x 61 (01100001)は Oxel (11100001)に変 
換される.それは8ビット符号付きの char で表した数である.この文字は直接 
ハードウェアから読むことができる.それから， int の蛮数に格納され，符号の拡 
張が行われる.つまり， Oxel (11100001)が， Oxffel (1111111111100001) 
に変換される. 

古い コンパイラの 中には ， Lattice C のように，暗黙のうちにす ベての char を 
符号なしとして扱うものもある.したがって，この符号拡張の問題は， char を符 
号付きの数であるとする，比較的新しい コンパイラにプロ グラムを移植するとき 
まで現れないだろう. 

自動型変換と符号拡張は，ともに，他にも予想外の方法で行われることがある. 
例えば，8ビットの int を使用した式 


2.11 練 


習 


53 


(64 *2)/2 

は一64と評価される. 64は16進数で 0 x 40 である.それに2をかけると， 0 x 80 
になる.しかし， 0 x 80 は8ビットの計算機では負数である（値は一128である）. 
その数を2でわると OxcO になる（符号拡張をともなった右シフトをする）.すな 
わち_64である. 

才_バ _ フロー もまた問題である. 

(64 * 32)/16 

は，8ビットの int ならば，0に評価される. 32でかけることは5ビット左シフト 
することである.しかし，64を5ビット左にシフトすると，唯一の大切なビット 
を数の左端に消してしまう.つまり，01000000は5ビット左にシフトすると 
0100000000000になるが，8ビットの精度では下位8ビット以外は，すべて 
切り捨てられ0になる. 

これらの問題は10章で再び取り上げる. 

2.11 練 習 

2-1 10進数93と一56を2進数，16進数，8進数に変換しなさい. 8ビット語 
長を使用すること. 

2-2 10進数17と一11を2進数にして，それらを2進数でかけ，その過程を 
(図 2.7 のように）示しなさい. 6ビットの演算数を使って，12ビットの結 
果を生成しなさい. 

2-3 2進数で表した21を3でわり，その処理の過程を示しなさい. 6ビットの 

符号なし非除数と3ビットの符号なし除数と商を想定しなさい.余りは何 
になるか. 

2-4 次の式をどのように評価するか.その作業の過程を示し，答えを10進数と 
16進数で表しなさい.すべての演算数と答えは8ビットの数を想定しなさ 
い . C の構文を数の基数を識別するために使いなさい. 

a . (111 & 011 ) A 0 xa 5 

b . -(0 x 55 + 0252) 

c . 127*3 

d . (0 x 62 <<1)/2 

e . 17 | 36 

f . 64 * (32 / 16) 

g . (17 < 11)+ ((93 && 66) || 56) 



54 


2. 2 進数 演算 


2-5 次の式は何を行うか. 2，3の具体的な例をあげて答えを証明しなさい. 

a "= b a "= b ; 

2-6 ときには， int や long の範囲より大きな数を操作する必要がある.これら 
の大きな数の計算を行うことができる large integer の操作パッケージがい 
くつか存在する.数自体が配列に入れられている.次の large integer ルー 
チンを書きなさい. 


# define NUMBYTES 8 

typed ef char B I G I NT [ NUMBYTES ] /* 64 ビット幅の integer */ 

b _ a t oi ( str , num ) 

char s t r []; 

BIGINT num ; 

mult ( multiplicand , multiplier , product ) 

BIGINT multiplicand , multiplier , product ; 

add ( num 1 f num 2, sum ) 

BIGINT num 1, num 2, sum ; 

negate ( num ); 

BIGINT num ; 

print _ hex ( num ); 

BIGINT num ; 

b_atoi ( str , num ) は large integer の 16 進表現を含む ASCII の文字列を 
入力する.そして，その数を 2 進数に変換し， num に 2 進数で格納する. 
例えば 

BIGINT num ; 

b _ a t 〇 i ( "0 x 123456789 a" r num ); 

への呼出しは，次のように配列 num を初期化する. 

num [ 0 ] == 0 x 9 a <-- LSB 

num [1]== 0 x 78 

num [2] == 0 x 56 

num [3] = = 0 x 34 

num [4] == 0 x 12 

num [5] == 0 x 00 

num [61 = 二 0 x 00 

num [7] == 0 x 00 

mult ( multiplicand , multiplier , product ) は， multiplier に multiplicand を 

かけ， product に結果をおく.結果が大きすぎて， BIGINT に格納できなけ 
れば〇をかえし，格納できれば1をかえす. add ( numl , num 2, sum ) は， 
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=12345678 (10 進数） 

= 0000000 000 bc 61 Ae (16 進数） 

= -87654321 (10 進数） 

= f f f f f f f f f ac 6804 f (16 進数） 

= ffffffffffA 39 eb 2 
= fffffffffb 82619 d 
= 0000000005 f 5 e 0 ff 
= fffc 27 c 9 d 91 d 0712 

= 0000000000000000 (R 0000000 000 bc 614 e ) 

= 123456789012345678 (10 進数） 

= 01 b 69 b 4 ba 630 f 34 e (16 進数） 

= 123456789012345678 (10 進数） 

= 01 b 69 b 4 ba 630 f 34 e (16 進数） 

= feA 964 b 459 cf 0 cb 2 
= 036 d 36974 c 61669 c 
= 0000000000000000 
=( to 効） 

= 0000000000000001 (R 00000000000000 00) 


2-7 次のルーチン 


numl と num 2 を加えて結果を sum におく. negate ( num ) は2の補数を 
使用して， num を負数にする print _h ( num ) ;は数を16進でプリントする. 
プログラムは，ワード幅 （ NUMBYTES として# define しておく）を NU 
MBYTES だけを修正するだけで変更できるようにするべきである.つま 
り，ワード幅を変更するためには， NUMBYTES を修正して再コンパイル 
するだけでよい.この場合プログラム自体は変更する必要がない.プログ 
ラムは NUMBYTES で（無理のない範囲の）正の整数を設定して動くよう 
にすること. 

ルーチン全体は負数や〇の非演算数を適切に処理することができること. 

さらに，2つの非演算数は，演算数のうちひとつが結果 （ sum ， product 等) 

になるのでなければ，変更できない. mult ( )， add () への3つの引数 

はすべて同じでよい.例えば 

BIGINT num ; 
b _ a t 〇 1 ("10", num ); 

add ( num # num , num ); 

で動作する. add () からかえったとき， num は20を含んでいる.自分で 
テスト•データを工夫しなさい.しかし，次の数はデータに含めなさい. 


1122 C1111 1 
nnnnlnnnn n 


12 2 n 


n n n n 


div ( dividend , divisor , quotient , remainder ) 
BIGINT dividend , divisor , quotient , remainder ) 
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を 2-6 で作成した BIGINT パッケージに加えなさい.このルーチンは， 
dividend を devisor でわり，結果の数を商と余りに入れる.作成するルーチ 
ンは次の式 

123456789012345678/123456789012345678 

を計算し，商が1，余りが0にならなければいけない.余りが正しい符号 
になっているか確かめること.次の式が維持されているべきである. 
((dividend/divisor) * divisor) + remainder == dividend 
2-8 b _ atoi () を変更して，10進数と16進数で表した文字列を入力とすること 
ができるようにしなさい. Ox が前におかれているか調べ，あれば16進数 
として扱い，なければ10進数として扱うようにすること . BIGINT num 
を10進数で出力するルーチン printd ( num ) を書きなさい. 


3 アセンブ 1 J 言語 


◦プログラマが，アセンブリ言語の基礎を知る必要があるのには，いくつか理 
由がある.高級言語ではあるけれども， c はかなりアセンブリ言語に近い.通常， 
アセンブリ言語で書かれる多くのタスク（高機能算術計算ルーチン，割込みルー 
チン，等）は， C 言語でも書くことができる. C 言語を活用するためには，アセ 
ンブリ言語の基礎知識を知っている必要がある.同様に， C 言語の演算子の多く 
(ビットごとの論理演算子，シフト演算子，等）は，アセンブリ言語命令に似てい 
る.アセンブリ言語を知ることは， C 言語を理解する助けにもなる.多くのアセ 
ンブリ言語の概念（間接命令，等）が， C 言語の概念（ポインタ等）に反映してい 
る.基礎になる言語を学ぶことは，より高度な構成概念を理解するのに役立つ. 
しかし，アセンブリ言語を知ることの，もっとも重要な理由はデバッグである. 
次章で， C コンパイラで使用されるコード生成技術について詳しく調べる•コン 
パイラがどのようにサブルーチンを呼ぶのか，変数がどのようにメモリに格納さ 
れるのかを知ることは，発見しにくいバグを徹底的に調べるときにたいへん役立 
つ. アセンブリ言語を少しも知らないでは，そんなバグを解決できない. 

本章では，プログラマの立場から，コンピュータがどのように構成されている 
か，そのコンピュータを操作するために必要とされる基本的なアセンブリ言語を 
みる.ここで述べる言語と計算機は実在しない（もっとも，68000や PDP -11 をか 
なり引用している）.このデモ計算機は，たいていの実在の計算機よりプログラム 
するのが簡単である.実際のアセンブリ言語プログラミングに共通する，多くの 
問題にもここでは触れていない.さらに，この言語は， C 言語に関連した問題を 
みるのに役立つように設計されている.概念を学ぶのであるから，不必要な詳細 
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を述べて複雑にすると的はずれになる. 

人は，アセンブリ言語にいくぶん好き嫌いがある.すでに8080か Z -80 を知っ 
ていて，他のものを知らなければ，アドレッシング.モードのセクションを特に 
注意して読むようにする.デモ計算機は，拡張アドレッシング•モードはサボー 
卜していない.本章での，もう ひとつの 重要な概念は“サ ブルー チン•コールと 
スタック”のセクション （3.5.4) にある.これは，次章に進む前によく理解し 
ておく必要がある. 

3.1 アセンブラとは何か 

アセンブリ言語（あるいはアセンブラ）は，その各命令が，直接機械 レベルの 
コードに翻訳されるプログラミング言語である.つまり，アセンブリ言語のプロ 
グラムは，計算機が使う2進コードに直接変換することができる.ひとつのアセ 
ンブリ言語命令は， 直接 ひとつの 機械 命令に変換される.このレベルでは，コン 
ピュータは 基本的に 精巧な加算機にすぎない.それは，ひとつのメモリ •セルの 
内容を他へ転送したり，2つの数をたしたリするような単純な動作だけができる. 
多くの卓上計算機は，たいていのコンピュータよりももっと強力な命令を持って 
いる（ただし，コンピュータの方がはやい）. C 言語のような高級言語は，数行の 
アセンブリ言語命令を必要とする動作を1行で行うこともできる.実際には，コ 
ンパイラを高級言語からアセンブリ言語への変換機としてみることもできる. 

3.2 メモリ構成とアライメント 

コンピュ_夕のメモリは，それぞれが別のアドレスを持ったセルの並びからで 
きている.よく似ているものは，ページごとに数が付いた本である.ページの物 
理的なサイズは，1ページに書いてある行数で制限される.行数が，1ページ当り 
の行数より大きくなったら，次のページにしなければならない.このたとえでは， 
各べージが1 つの セルであり，ページ数がセルのアドレスである.1ページに ちょ 
うどよい行数は，計算機のワード幅（メモリのひとつのセルに含まれる2進数の 
桁の数）である.もっと厳しい制限がある. 2ページ使うほど大きな数は，向か 
い合う2ページを使わなければならない.大きな数の半分に対して，1ページを 
当てはめることはできない.この最後の制限は，アライメント （ alignment ) と呼 
ばれる.本の最初のページは，0 (0 は偶数である）と数字が付けられる.実際に， 
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左側のすべてのページは偶数である.ここで使う計算機は，16ビットのワードで 
ある.各ワードは，2つの8ビットのバイトに分割される.そして，各バイトに 
はアドレスがある.つまり1ワードには2八イト必要であるから，各ワードは2 
つのアドレスを占める.このデモ計算機は，バイトとワードの操作が異なる•バ 
イト操作は，計算機内のどのバイトに対しても行うことができる.しかし，ワー 
ド操作 （16 ビットの加算のような）では，いつも演算数の下位バイトに偶数アド 
レスを使う.そして，その上位バイトには，下位バイトより1つ大きいアドレス 
を使う.ワードが偶数アドレス上に並ぶことになるので，これをワード.アライ 
メントと呼ぶ.計算機の中には，もっと複雑なアライメント制限をさせるものも 
ある.例えば，8086のセグメントレジスタは，16バイト （ paragraph ) 毎の境界線 
( boundary ) 上に配置しなければならない. 

デモ計算機のアライメントを図 3.1 に示している. MSB は最上位バイト （Most 
Significant Byte ) を表し ， LSB は最下位バイト (Least Significant Byte ) を表 
す.10進数で説明すると，2桁の数56では5が最上位バイトで，6が最下位バイ 
卜である. 
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図 3 • 1 メモリ構成 


本章にあるすベての命令は， W が続いていなければ，1バイトに対して操作を 
行う.例えば， MOV 命令は，1八イトをある場所から別の場所へ移す. MOV.W 
はワードサイズのもの （2 バイト）を転送する. 

コードとデータは，同じメモリ領域を共有する.コンピュータは，セルに命令 
が入っているのか，データが入っているのか区別できない.たいていのマイクロ 
コンピュータでは， C プログラムが実行中のコードを誤って修正することが可能 
である.実行中であれば必ず破滅的なことになる.また，データのメモリ領域を 
誤って実行し始めることもある.これも悲劇的なことになる. 
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3.3 レジスタと計算機の構成 

アセンブリ言語がどのように動くか理解するために，まず，それが動作する計 
算機についてみてみなければならない.たいていのコンピュータは，2つのはっ 
きりと異なる部分一中央処理装置 （ CPU ) とメモリーに分けることができる . CPU 
は，バスと呼ばれる配線の集合を通して，メモリにアクセスすることができる. 
主メモリに加えて，すべての CPU はレジスタと呼ばれる少数の内部メモリを持っ 
ている.ハードウェアによる CPU 上のさまざまな拘束のために， CPU が主メモ 
リにアクセスするのは，内音 IS メモリにアクセスするよりも時間がかかる.したがっ 
て，よい C コンハ。イラは，生成するコードにかなりレジスタを使用している • C 
言語の予約語 register は，レジスタが使えれば，変数の格納にレジスタを使わせ 
る（レジスタの数に制限がある.コンパイラは，コンパイル作業にレジスタのい 
くつかを使う）.メモリのアドレスは，実際には， CPU がメモリにアクセスする 
とき，バスにかける1セットの電圧を表す方法である. CPU が，レジスタをアク 
セスするのにバスは必要ない.それでレジスタにはアドレスはない.代わりに， 
レジスタは名前を持っている. 

簡単な計算機は，アキュームレイタ （ accumulator ) と呼ばれるレジスタ（卓 
上計算機では表面にある小さな窓にその内容が表示される）を持っている.すべ 
ての演算の結果は，そこで計算される.全部の命令がアキュームレイタを使う. 
たいていの計算機は，レジスタが2〜3個付加されている.レジスタには，アキ 
ュームレイタの現在の内容が格納され，後で取り出される.また，ある命令（格 
納ゃ回復）にも使われる.コンピュータも，同じような構造を持っている•しか 
し，レジスタには，アキュームレイタより， A , B ， C ， 等の名前が付けられてい 
る.同様に，命令はレジスタだけをアクセスするものがあり，一方，メモリをア 
クセスするものもある. 

デモ計算機には A , B ， C ， D ， SP , PC , FP , FL と名付けられた全部で8個 
のレジスタがある.それらを図 3.2 に示す. 

全レジスタは，16ビット幅 （2 バイト）である • A ， B ， C ， D レジスタは汎用 
レジスタである.これらはアキュームレイタとしても使える.他のレジスタは， 
専用レジスタである.これらのレジスタは，レジスタに影響する命令の説明をす 
るときにどのように使用されるかわかるだろう（ただし， FP は次章で説明する）. 
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図 3.2 デモ計算機レジスタ•セット 


プログラム•カウンタ （ PC ) は特殊レジスタである. PC は，いつも現在実行 
中の命令のアドレスを保持している. PC は，命令が実行されるごとに，次に実 
行される命令のアドレスを保持するため，自動的に更新される.デモ計算機の全 
命令は，必ず2バイト占める.それで PC は通常，命令ごとに2ずつ増加する. 
ここで，重要な概念は， PC が命令そのものではなく，次の命令のアドレスを保 
持することである.命令が実行されるとき，計算機は，まず， PC に示されたア 
ドレスにある命令をフヱッチして，その命令を実行する. 

3.4 アドレッシング.モード 

計算機の命令はすべて，その実行の途中でメモリかレジスタをアクセスする. 
多くの実在するコンピュータとは違って，すべての命令がレジスタのいずれかを 
使う.例えば， ADD 命令は，8個のレジスタのうちいずれかに数をたす.多くの 
コンピュータは，各命令が使うレジスタを制限している.例えば，卓上計算機の 
ようなものでは，+キーはアキュームレイタだけを使う（他の格納用レジスタを 
使うことはできない）.格納用レジスタの内容を更新するには，アキュームレイタ 
にその内容を移して，それからアキュームレイタの内容を更新し，再び結果を格 
納用レジスタにもどさなければならない. 

レジスタとメモリのアクセスは，数種類の方法のうちのひとつで行われる.例 
えば，メモリやレジスタを直接アクセスすることができる.また，あるアドレス 
からのオフセットにあるメモリをアクセスすることもできる.アドレスを使用す 
るさまざまな方法をアドレッシング • モードという. 

この後に続く命令の説明では，アドレス，または，レジスタを表すのに rN を 
使う.アドレスとレジスタは，さまざまなアドレッシング.モードで使用される 
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から，実際にはすべての場合を列挙しない.むしろ， rN の表記を後に続く物で置 
き換えることができる. 

3.4.1 レジスタ直接アドレス 

rN をレジスタ名で置き換え，そのレジスタの内容を参照する.このモードを， 
レジスタ直接アドレッシングという.命令 MOV A , B は， A レジスタの内容を 
B レジスタに移す • B レジスタの前の内容は壊され， A レジスタの内容はかわ 
らない.これは1バイトの転送だから （. W が MOV についていない）， A と B レ 
ジスタの下位バイトだけが使用される.上位バイト（ビット8から 15) はかわら 
ない. MOV.W A ， B は上位と下位のバイトが転送される. 

C 言語での同じ繰作は x = y である.ここで， x と y はレジスタ変数である.す 
なわち 


y ; 


である. 
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3.4.2 メモリ直接アドレッシング 

rN が数に置き換えられると，その数をアドレスとするメモリの内容がアクセス 
される.命令 MOV 100，200は，100番地にあるメモリの内容を200番地にある 
メモリに移す.100番地の内容はかわらない，しかし，200番地の内容は破壊され 
る.ワード幅の命令 MOV . W 100，200は，100番地のメモリの内容を200番地 
のメモリに移し，101のメモリの内容を201のメモリに移す. MOV ， W 100， A は， 
100番地の内容を A レジスタの下位バイトに入れ，101番地の内容を A レジスタ 
の上位バイトに入れる.ワード幅のものを奇数のアドレスへ，または，奇数のア 
ドレスから転送しようとすると エラー になる（つまり， MOV . W 101， A は間違っ 
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図 3 • 4 直接アドレッシング 


た命令である）. 

C 言語では，やはり x = y ; であるが，2つの変数は static で宣言される. 

static 1 n t x , y ; 

x = y ; 

メモリ•アクセスは，レジスタ•アクセスより時間がかかることを覚えておく 
べきである.同様に，たいていの計算機では，メモリ•アクセスはもっと長い命 
令長を必要とする（例えば，1ワードでなく 2ワードの命令である）. 

3.4.3 即値アドレッシング 

数の前に#が付いていれば，指定されたアドレスのセルの内容でなく，その数 
自体が使われる.命令 MOV #100，200は，数100をメモリ200番地に入れる. 
MOV.W #999， A は， A レジスタに999を入れる.レジスタへの即値命令は，メ 
モリを変更する命令よりもはやい.さらに，すべての即値命令はメモリからメモ 
リへの転送命令よりもはやい.次は， C 言語での等価の文である. 

register int x ; /* A レジスタを 使用する * / 
static int y ; /* メモリ200番地を使用する * / 

x = ' ; /* MOV . W #42, A を生成する*/ 

y = 3 ; /* MOV.W #3,200を生成する ★/ 

最初の代入の42は，のことである. C 言語では，クオートひとつ （ ， ） で 
囲まれた文字はその文字の ASCII コードに評価される.，*，は ASCII で 0 x 2 a ， 
または，10進数の42である. 


3.4.4 間接アドレッシング 

表記 （ rN ) は，間接アドレッシングのために使われる.このモードでは，指定 
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図3 . 5 レジスタ間接アドレッシング 


されたレジスタ，または指定されたメモリ内のアドレスにあるメモリ•セルの内 
容がアクセスされる.例えば，レジスタ A が100を含んでいると，命令 MOV 
( A ), B はメモリ番地100の内容をレジスタ B に移す.この例が図 3.5 に示され 
ている. 

他の例では，レジスタ A が100にセットされ，レジスタ B が200を含んでいる 
とき ， MOV ( A )，（ B ) はメモリ100番地の内容をメモリ200番地に移す.どちら 
のレジスタも変更されない. 

最後の例は，命令 MOV.W (100)， （200) は，100番地の中にあるアドレスで指 
定されたセルの内容を，200番地の中にあるアドレスで指定されたセルに移す. 
これはヮード幅で転送する.この例を図 3*6 に示す. 

間接アドレッシングは，重要な概念である.レジスタが操作されるべきメモリ 
のアドレスを含んでいる.そして，レジスタ自体は変更されない.レジスタが含 
んでいるアドレスにあるセルが操作対象である.この関係を表現するために，指 
し示すという言葉を使う.いまの例では， A レジスタは，100番地のメモリを指 
し示している.つまり，100番地のメモリはアドレスが100で， A レジスタに指 
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202 : | 


一 | 

1 202: | 


300: | 

• 

1 300: | 

一 _ p I I . 


302 : ! 

0 

302: | 

999 

304: | 

999 

| | _ ■ 
1 304: | 

999 

306 : j 


J 

1 306: | 

100 番地の中のアドレスにあるセルの内容を 

200 番地の中のアドレスにあるセルに移す. 

図 3 • 6 メモリ間接アドレッシング 



し示されている. 

C は，すべての auto 変数 （ static と，はっきり宣言されていない口ーカル変 
数）をアクセスするために，間接アドレッシングを使う•次章でその理由を述べ 
る.間接アドレッシングは，ポインタ操作にも使われている.例えば 


register int 

*Pi 

; /* A レジスタを使用する ★/ 

l n t 

X ； 

/★ メモリ番地 200 を使用する*/ 

i n t 

y ; 

/* メモリ番地 202 を使用する*/ 

p = & X ; 

/* 

/* 

X のアドレスを p に入れる * / 

MOV.W #200， A を生成する */ 

*P = 5; 

/* 

/* 

5をメモリ200番地に入れる命令*/ 
MOV.W #5，（ A ) を生成する */ 

y = * p ; 

/* 

/* 

/* 

MOV.W ( A )，202 を生成する */ 

メモリ番地 200 と 201 の内容を */ 

202と203番地にコピーする * / 


のように使う. 
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3. 4.5 後置きの自動インクリメント付間接アドレッシング 

このモードでは，表記 （ rN ) 十が使用される.動作の実行は，アクセスされる 
セルのアドレスを， rN が保持している直接アドレッシングに似ている.しかし， 
rN に含まれているアドレスにあるセルが，アクセスされた後，レジスタの内容が 
更新される.命令がバイト•サイズのオブジェクトの操作であれば，1が rN に加 
えられる.この処理は， C の++演算子と同じである.例をあげると， A が100 
を保持しているとき，命令 MOV ( A )+， B は，100番地のメモリの内容をレジス 
夕 B に転送する.そしてレジスタ A は自動的に101に増加される（この命令は， 
バイトを転送したのであるから） . A レジスタと B レジスタは，変更された.しか 
し，100番地のメモリは変わらない. MOV.W ( A ) +， B は，100と101のセルの 
内容を B レジスタに移す.そして， A レジスタに2が加えられる.ここで重要な 
ことは，転送されるものの型によって増加する幅が違うことである.1バイト転送 
されると，レジスタは1増加する.1ワード転送されると，レジスタは2増加する. 

C 言語の自動インクリメントの，主な使用法は，ポインタを使った配列のアク 
セスである. 


MOV . W 


前： 




99: 

1 


| :98 

_ I 

101: 

1 

1 

I 

99 

| :100 
_ I 

103: 

1 

1 


| :102 


後： 




99: 

1 

里 


| :98 

_ I 

101: 

1 

1 

I 

99 

| :100 

I 

103: 

1 

1 


| :102 


( A)+,B 


A : 


B : 


A : 
B : 


100 


0 



4 G 9 

102 



6 

99 



A レジスタ内のアドレスにあるメモリ.セルの内容を B レジスタ 
に移す. B レジスタをワードのサイズだけ増加する. 

図3 • 7 自動前置きイ ンクリメン ト付き間接ア ドレッシング 
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static int x [ 2 0 ] ; /* メモリ番地 200—239 を使用する*/ 

register int *xp ; /* A レジスタを使用する * / 

xp = X ； /* MOV.W #200 , A ★/ 

*xp + + = 'c • ; /* MOV.W U 99 , ( A ) + */ 

この例は複雑なので，少し説明を必要とする（この題材は7，8章で詳述する. 
それで本章を読み終わるまでとばしても よい）. X は整数配列であり， int は 2 
バイト使用する.それで，この配列には 40 バイトのメモリを必要とする.配列の 
最初のセル （ x [0]) は， 200 と 201 番地にある.次のセルは， 202 と 203 番地にあ 
る.残りも同様である. C 言語では，自動的に配列名がその配列の最初の要素の 
アドレス （200) に評価される.式 xp = x は，配列を指し示すポインタ（この例で 
は A レジスタ）を初期化する.つまり， A レジスタに x の最初の要素のアドレス 
が入れられる. 

* xp + + =， c ’ を説明しよう • A レジスタは， 200 ( x のアドレス）を含んでいる. 

間接アドレッシングが使われているから，アドレス200のセルの内容は変更され 

る.それで99 (’ c ’ の ASCII コ_ド）がメモリの番地200と201に入れられる（こ 

れはワード転送だから）.それから，ポインタ （ A レジスタ）が増加する.ワード 

転送だから2が加えられる. A は，202 ( 配列の次の要素のアドレス）を含むこと 

になる.面白いことに，ほとんど同じプログラムが文字配列に使われている. 

static char x [ 20 ] ; /* メモリ番地200 —219 を使用する*/ 
register char *xp ; / * A レジスタを使用する * / 

xp = x ; /* MOV.W #200 , A */ 

* xp ++ = ' c '; /* MOV #99,( A ) + */ 

MOV . W が，やはリポインタを初期化するのに必要とされることに注意しなさ 
い.すべてのポインタは，指し示すものに関係なく，同じサイズである（ポイン 
夕は，他の変数のアドレスを保持している変数である.だから，ポインタのサイ 
ズは，個々の計算機でアドレスを保持するのに必要なバイト数である）.文字配列 
を扱っているので（この配列は20バイトを占める），配列をアクセスするのには 
MOV . W よりむしろ MOV を使う.そして，ポインタには，2ではなく，1が加 
えられる（ワード転送ではなくバイト転送を使っているから）. MOV が実行され 
た後，メモリ番地200は99を含み， A レジスタは201を含む. 

3.4.6 自動前置きデクリメント付き間接アドレッシング 

このモードでは， 一（ rN ) 表記が使われる.動作は，フヱッチする前にレジス 
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MOV.W -(A) , B 


前： 

96: 

98: 

100 : 


999 


0 


102 


A : | 100 

I - 

B : | 3 


後： 


96: | 

1 

1 一¬ 
八： | 

406 98 


1 _■ 

999 | 


98: | 

1 -■ 
B : | 

999 


1 -■ 

0 | 


100: | 

1 -- 



1 -* * 

102: | 






A レジスタを 減少させる.更新され た A レジスタの 中のア 
ドレスに あるメモリ. セルの 内容を B レジスタに 移す. 

図 3 • 8 自動前置きデクリメント付き間接アドレッシング 


夕の内容をデクリメント（減少）すること以外，自動後置きインクリメント付と同 
じである.例えば’ A レジスタが100を保持しているとき，命令 MOV —( A )， B 
はレジスタ A を99に減少し，そしてメモリ番地99の内容をレジスタ B に移す. 
自動前置きデクリメントでも，レジスタを更新する数は転送されるもののサイズ 
によって異なる.レジスタ A が100を保持しているとすると， MOV.W -( A ), B 
は A レジスタを2減少させて（ワード転送だから） 98 にする.そして’ 98と99番 
地のメモリ.セルの内容が B レジスタの下位と上位バイトに移される.さきほど 
の C プログラムの例を使って変更すると，前置きデクリメントは次のように使 


われる. 


static cnar 
register char 

xp = &x [20]; 
*--xp = ' c '; 


x [20] ; /* メモリ番地 200—219 を使用する ★/ 

*xp ; /* A レジスタを 使用する *〆 

/* MOV.W #220 , A */ 

/* MOV #99, -( A ) */ 


配列の最後を指し示すように，ボインタを初期化していることに注意しなさい. 
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実際は，配列の終わりをこえたひとつのセルを指し示すように初期化されている. 

セルをアクセス する前に減少させる ので あるから ， A レジスタは 代入が行われる 

ときには x [19] (のアドレスを保持して）を指し示す. 

デモ計算機は，前置きデクリメントと後置きインクリメントをサポートしてい 

る.しかし，後置きデクリメントと前置きインクリメントはない.多くの実在す 

るコンピュータでもそうである.たいていは，スタックの管理に前置きデクリメ 

ントと後置きインクリメントを必要とするが，後置きデクリメントと前置きイン 

クリメントは必要としないからである.後でもっと深くこの問題を取り上げる. 

C 言語での関連した問題は，ひとつではなく 2つの命令が，これらのサポートさ 

れていない関数のうちひとつを行うために必要とされる.例えば 

xp = &x [20] ; /* MOV.W #220 , A */ 

*xp-- = •c * ; /* MOV # 99 , (A) */ 

/* SUB #1 f A ，•デクリメント ★/ 


3.4.7 指標付きアドレッシング 

表記 x ( rN ) は，指標付きアドレッシングを表すために使用される.このモード 
では， rN の内容に x を加えて，その加算結果であるアドレスのセルの内容がアク 
セスされる.オフセット x は負数でもよい.レジスタ自体は変更されない•例え 
ば， A レジスタが100を含んでいるならば ， MOV 10( A )， B 命令は110番地（100 
+10だから）のメモリを B レジスタに移す. A レジスタ自体は変更されない•こ 
のアドレッシング.モードは，配列の1要素をアクセスするのにも使用される. 

A レジスタが 文字配列の ベ_ス•アドレス を 含んでい るとき ， MOV 12( A ), B は 
配列の13番目の要素を B レジスタに 移す（最初の要素は配列の ベース.アドレス 
からオフセット0のところにある）. 

配列をアクセスするこの能力を維持するのに，ワード転送はいくぶん複雑にな 
る.初めに A レジスタに100が入っていると， MOV.W 12( A )， B は A レジスタ 
の内容に24をたし，124と125のセルの内容を B レジスタに移す.つまり，ワー 
ド転送なので，指標は最初に2がかけられる.このかけられた値は希望のアドレ 
スを与えるために， A レジスタの内容に加えられる.それで，この最後の例は， 
整数配列（文字配列と比べて）の13番目の要素をアクセスするだろう. 

ワード転送でもうひとつ複雑なことはアライメントである.通常，偶数アドレ 
スからだけ，ワード•サイズのものをアクセスできる.したがって，ワード転送 
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MOV . W 2( A ) , B 


前： 


96 

98 

100 

102 


:1 


1 

_ I 

1--- 
A : | 

I 

96 


1 " ~ 

3 

1 

I 


• 1 

1 

I 

1 

B : | 

1 

0 


1 "" 
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1 

I 


-1 

1 

1 

_ I 

1 



1 

:1 

• 

1 

1 





後： 

96 

98 

100 

102 


:1 

1 


1 

_ I 

1 — 
A : | 

I 

96 


1 

• 塵 

3 

1 

I 


• 1 

1 

1 

I 

1 

B : | 

1 

999 


1 

• I 

999 

1 

I 


• 1 

I 一 — 

1 

I 

1 



1 

:1 


1 

1 





アドレスが A 十 （2* ワード•サイズ）である 
セルの内容を B レジスタに移動する. 

図 3-9 指標付きアドレッシング 


をするときは，ベース•アドレスが偶数であるように気をつけなければならない. 
指標に自動的に2をかけることで，すべての対象アドレスもまた偶数であること 
を保証している. 

C 言語では，指標付きアドレッシングは配列をアクセスするのに使われる.次 
の例を考えてみる. 

int array [10] ; /* 200— 220番地のメモリをイ吏用する 00-220 */ 

array [0] =1; /* M 0 V.W #200 , A ; A =西己列のアドレス */ 

/* MOV . W #1,0( A ) ; A [0] =1 */ 

array [6] = 2; /* MOV.W #2,6( A ) ; A [6] =2 */ 

まず配列のベース•アドレスを指し示すように， A レジスタの初期化から始め 
ることに注意する. C 言語では，実際はデータの型として配列をサポートしてい 
ない.言いかえれば，配列は本当のオブジェクトではない.むしろ，配列へのポ 
インタが本当のオブジェクト である. 例えば，配列をサブルーチンに渡すとき， 
配列自体を渡すのではない （ Pascal では配列を渡せる）.代わりに，最初の要素の 
アドレス（最初の要素へのポインタ）が渡される.したがって， C 言語では，配 
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列名は配列の最初の要素のアドレスに評価される.コンパイラが配列名をみたと 
きに，まず行うことは， A レジスタにその配列への隠れたポインタをつくること 
である.つまり，コンパイラは， A レジスタにその配列のベ_ス•アドレスを移 
す.すべての配列へのアクセスは，このポインタを経由して行われる. C では 


char * xp = array ; 

* ( x p + 6 ) = 2 ; 

に違いはない•実際に，多くのコンハ。イラが，この2つに同じ命令コードを生成 
する. 

この例では，計算機にアドレス計算をさせている.整数配列にアクセスして（こ 
れはどの要素も2バイト使用する），ワード転送を使うから， MOV.W #1，0( A ) 
はメモリ番地200と201をアクセスする. MOV.W #2,6( A ) は，番他212と213 
を変更する.つまり， （6* int サイズ）が A レジスタにあるアドレスに加えられて 
(しかし， A レジスタは変更されない），セルがアクセスされる.配列が構造化さ 
れているならば，自分でアドレス計算をしなければならない. 

3.5 命令セット 
3.5. 1転送 （ move ) 命令 

デモ計算機では，転送命令はひとつだけある.それがどのように使用されるの 
か，もうすでにいくつかの例でみてきた. 

MOV rl , r 2< - >Move rl to r 2 

3.5.2 算術命令 

指定された算術演算を行うことにカロえて，すべての算術命令はフラグレジスタ 
のひとつ以上のビットを演算結果に基づいて修正する.特に 

結果が〇ならば， z フラダが1にセットされる. 

結果が整数ならば， p フラグが1にセットされる. 

結果が負数ならば， N フラグが1にセットされる. 

結果がレジスタをオーバー フロー したら， 

(結果が16ビットよリ大きかったら，） 

V フラグが1にセットされる. 
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A : 


B : 


5 

15 


| — — — — — — — f — + — + — + — | 

| 0 0 0 0 1 フラグ•レジスタ 

| — — — — — — — + — — t — | 

V Z P N 


SUB.W B,A ( A レジスタから B レジスタをひき，結果を A レジスタにおく. 

さらに，結果 （一10) が負数なので N フラグが1にセットされる） 


| — — — _一一一 + — + — "f — + — | 

| 00011フラグ•レジスタ 

I — — — — — — — + — + — t — + — I 

V Z P N 

ADD • W #1 ,B ( B レジスタに 1 を加える. N フラグは0にクリアされ，加算の結 

果が正数だったのて - P フラグが1にセットされる） 


A : 

1 

1 

| _ 

-10 

B : 

1 

1 

1 

15 


A : 

1 -- 
1 

-10 

B : 

1 — 

1 

1 

16 


I — — — — — — — + — + — + — | 

| 0 010丨フラグ•レジスタ 

I — — 一一一一一 + — + — + — T — | 

V Z P N 

図3 • 10状態フラグ 


これらのフラグは，次章で述べる分岐命令で順に使われる.フラグの動作を図 
3-10 に示す.算術命令は，2つのレジスタを変更することに注意すべきである. 
命令に規定された目的レジスタとフラグレジスタ（演算結果を反映する）である. 


ADD rl , r 2 r 2 に rl をたして，結果を r 2 におく （ r 2= r 2+ rl ). 

SUB rl , r 2 r 2 から rl をひいて，結果を r 2 におく （ r 2= r 2— rl ). 

AND rl ， r 2 ビットごとに rl と r 2 を AND して，結果を r 2 におく. 

OR rl ， r 2 ビットごとに rl と r 2 を OR して，結果を r 2 におく. 

NOT rN ビットごとに rN を反転 （ 1の補数に ） する. 

SHR x，rN rN を x ビット右にシフトする （0 く x く 16). 最上位のビットは2 
重化される（つまり，最上位のビットが1ならば，1が残される. 
そうでなかったら，0が残される）.この2重化はシフトされる数 
の符号を維持する. 

SHL x，rN rN を x ビット左にシフトする （0 く x <16). もっとも右のビット 


に0が入れられる. 
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例 ADD 2000, ( A ) は A レジスタに含まれているアドレスのセルの内容を，ア 
ドレス2000にあるセルの内容に加える.結果は ， A レジスタに含まれているアド 
レスのメモリに格納される . SUB #2， C は ， C レジスタの内容から2をひく. 
ADD C , # 2 は誤りである.ひとつの命令には代入演算子が隠れていることに注 
意しなさい.たとえば， x += y は直接 ADD.W y ， x に変換される. 

3.5.3 ジャンプ命令（分岐命令） 

ジャンプ命令は，次の番地にある命令以外のところを指し示すように，プログ 
ラム•カウンタ（実行される命令のアドレスを含んでいる）を修正して行う . JMP 
は無条件ジャンプ命令である.単に指示されたアドレスにある命令を実行し始め 
る.指示されたアドレスに命令がなければ，予想できないことが起きる.他のジャ 
ンプ命令 （ JP ， JGE 等）は，対応するフラグの状態が真のときだけ実行される. 
JMP rN PC=rN 

JP r N P フラグが 1 にセットされているときだけ， PC=rN 

JGE rN P か Z フラグが1にセットされているときだけ， PC=rN 
JZ rN Z フラグが1にセットされているときだけ ， PC = rN 

JN rN N フラグが1にセットされているときだけ， PC 二 rN 

JLE rN N か Z フラグが1にセットされているときだけ， PC=rN 
JV rN V フラグが1にセットされているときだけ， PC=rN 

JNV rN V フラグが1にセットされていないときだけ， PC=rN 
他の命令も，次に示す例のように，ジャンプを行うことができる. 


ADD 

#128, PC 

PC = 

PC + 128 . 

SUB 

#4 , PC 

PC = 

PC - 4. 

ADD 

( C ) ,PC 

PC = 

PC + C レジスタ中のアドレ 
スにあるセルの内容. 

ジャンプ命令は goto 分岐， 

if/else 文， 

switch 文， while や for のような繰返 


し文を処理するために使用される.それらの文は，後でもっと深く調べる.サブ 
ルーチンの呼出しは，別のメカニズムでも行われるので，次のセクションと次章 
で調べる. 
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3.5.4 サブルーチン • コールとスタック 

2つのジャンプ命令は，独自のセクションを設けてもよいほど重要である.そ 
れは JSR (サブルーチンへのジャンプ）と ， RET (サブルーチンからのリターン） 
命令である.サブルーチンは，プログラム内のどこからでも制御を移されること 
のできる，これだけで独立したプログラムである.サブルーチンは，仕事をして 
から，サブルーチンを呼び出した命令の次の命令に制御をかえす.どこからジャ 
ンプしたのか知る必要があるので，通常のジャンプ命令ではサブルーチンに行け 
ない.この，もどってくる場所をリターン•アドレスという.リターン•アドレ 
スは，サブルーチンがまたサブルーチンを呼ぶこともあるので，固定したメモリ 
番地に格納することはできない.なぜならその2回目の呼出しが，最初の呼出し 
で書かれたリターン•アドレスに上書きしてしまうからである.この問題の解決 
法は，スタックと呼ばれるデータ構造である.一般の物にたとえると，カフェテ 
リアでのお盆の山積みである.最後に上におかれた盆が最初に取られる.最後に 
スタックに入れられたデータが最初に取り出される.スタックにデータを置くこ 
とをプッシュ （ push )， データを取り出すことをポップ （ pop ) という • SP ， または 
スタック.ポインタ，レジスタはスタックの管理に使われる. SP レジスタはいつ 


1 

1 

メモリ 

1 

I 

SP : 

1 - 1 

| 100 | 

ブッシュする 
前のスタック 
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100: | 

I 


1 

| <-SP 
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I 

メモリ 

1 

1 
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プッシュする： 

MOV.W A , -C SP ) 

1 

1 

■ 1 

SP : 

| 100 98 1 

( 1 ) SP = SP - 2 

(2) ( SP ) = A 

98: | 

I 

3 

1 

| <-SP 

1 

A : 

3 

100: | 

I 


1 

1 
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B レジスタにポップする： 

MOV.W ( SP)+,B 

1 

I 

1 

1 

SP : 

| 100 98100 | 

CD B = ( SP ) 

(2) SP = SP + 2 

98: 

I 

3 

1 

1 

1 
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1 

100: 1 


1 
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A : 
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1-1 


1 

1 


1 

1 



図3 • 11プッシュ操作とポップ操作 
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も，スタックにもっとも新しくオブジェクトがプッシュされたメモリのアドレス 
を保持する. MOV.W rN ，一( SP ) 命令でスタックに何かをプッシュし， MOV.W 
( SP )+， rN 命令でポップすることができる.この処理がどのように行われるか詳 
しくみてみよう（図3.11参照）. 

スタック•ポインタは，現在スタックの1番上にあるメモリ.セルのアドレス 
を保持している.プッシュ操作は次の2つのことを行う.まず，スタック•ボイ 
ンタを減少させる.そして，スタック•ポインタ（減少後）に現在あるアドレス 
のメモリにオブジェクトをプッシュする（この場合 A レジスタの内容）. A レジ 
スタのプッシュは C 言語では*- SP — A のように表す. 

ポップ動作は，プッシュ動作の逆である.ここでは MOV.W ( SP)+，B 命令を 
使う.まず，スタックの1番上にあるオブジェクトを（このオブジェクトを含む 
セルの アドレスがスタック•ボインタに含まれている），目的の場所 （ B レジスタ） 
に移動する.それからスタック•ポインタを減少させる.ポップに対する C 言語 
の文は， B =* SP ++ である.スタックから取り除かれたときポップされたオブ 
ジェクトは，実際はスタック上で消されないけれども，ポップ後は絶対に使うベ 
きではない.割込み処理ルーチンとコンパイラの実行時ライブラリによって起こ 
る問題がある.どちらもスタックを使用するのである.これらのルーチンの実行 
に気がつかないために；貴重なスタックの値に上書きされてしまいやすい.オブ 
ジェクトがポップされたとき，他のみえないルーチンによってスタック上でその 
オブジェクトに上書きされていないか確かめる方法はない. 

プッシュとポップは，一般的な動作であるので，このアセンブラでも専用のニー 
モニックをサボートする. 

PUSH rN は MOV.W rN ,-( SP ) に変換される. 

POP rN は MOV.W ( SP 〉+ ,「N に変換される. 

スタックは，16ビット幅のデータ構造である.同じスタック上に，16ビットと 
8ビットのオブジェクトをおくと管理が難しくなる.それで，ワードサイズの才 
ブジェクト用の命令と異なり，バイトサイズのオブジェクト専用の命令はない. 

スタックについて注意することがいくつかある. 

( 1 ) 前置きデクリメントを使うと，スタックポインタはいつも最後にプッシュ 
されたオブジェクトを手旨し示すことが保証される.このように，スタック 
の1番上のオブジェクトは，スタックポインタを通して間接的にアクセス 
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される. 


3. アセンブリ言語 


(2) 連続してプッシュしても，オブジェクトは別のメモリ番地におかれる.な 
ぜなら，プッシュの度に SP が減少されるからである.その結果，後のプッ 
シュで，前にプッシュされたものに上書きすることはない. 

( 3 ) スタックはメモリの下方に（下位番地の方向に）伸びる. 

ル_ル （3) は，特にマイクロコンピュータでは，いくつかの結果をもたらす. 
すでに，他のものを含んでいるメモリの領域を，スタックが浸食しているかチェッ 
クしない.スタックが大きくなりすぎた状態をスタック.オーバーフローと呼び， 
C プログラムの特にやっかいなバグの原因になる.多くの C コンパイラは図3.12 
のようにメモリを使用する.命令コードは，メモリのもっとも低いところにおか 
れる.静的データはその次におかれ，スタックは上位のメモリにおかれる.スタッ 
クは下方に伸びる.それで，スタックポインタはスタック領域のもっとも上位の 
番地を指すように初期化される . IBM PC のような計算機では，メモリの保護機 
能をサポートしていない.スタックが大きくなりすぎて，データ領域に上書きし 
たり，重傷の場合は，命令コード領域に上書きしてしまうこともありうる.デー 
夕領域に上書きしたら，広域変数はその値をかえ，意味がなくなってしまう.コー 
ド領域に上書きしたら， CPU は正当な命令だと思って，ゴミになったコードを実 
行し始めてしまう.次章で，スタックのオーバーフローの原因をいくつかみてみ 
る. 

たいていのメインフレームでは，スタック.オーバーフローの状態が進展する 
ことを許さない.オペレーティング•システムは，まずプログラムを終了させる. 
同じことが危険なポインタにも適用される.プログラムが，命令コード領域に上 
書きしようとしたら，オペレ_ティング•システムはプログラムを終了させる. 



図3 • 12 C プログラムのメモリ使用 
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UNIX では，このような異常な動作が起こると ， “segmetation violation , core 
dumped ” （セグメ ンテー ショ ン 違反） のエラー. メッセージを生成し，違反を起こ 
した プロ グラムを 終了させる. スタック.オーバー フローと危険なポ インタ は， 
マイクロコンピュー タでは現実の問題である. 


1 

10： | 

-| 

JSR 20 ド - PC 



1 

-| 
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1 



1 

20 | 
1 

-| 
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-| 
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1 

1- 

SP : 1 100 
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1 

_1 

1 

100: | 

1 
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1- 

里 

1 
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10: | JSR 20 



20 | RET | <-PC 


98: | 12 |<-SP 

I - I 

100 : | | 


JSR をした後の状態： 

JSR に続き命令のアドレスはスタック （98 番地） 
にプッシュされ， PC レジスタは JSR のひき数と 
置き換えられる. 

今は20番地の命令を実行している. 
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図3 . 13 JSR と RET 命令 



































78 


3. アセンブリ言語 


さて，もとの話題， JSR 命令と RET 命令にもどることにしよう. JSR 命令は 
2 つのことをする. JSR 命令に続く命令のアドレス（リターン•アドレス）をス 
タックにおき，そして，命令の引数であるアドレスに制御を移す. RET 命令 
は，スタックの 1 番上のものをポップして， PC に入れ，もとの JSR に続く命令 
に制御をもどす.この過程が図 3*13 に示されている. 

JSR rN アドレス rN にあるサブルーチンに進む. 

(1) SP 二 SP — 2 

(2) (SP) 二 PS+2 

(3) PC=rN 

RET サブルーチンからもどる. 

(1) PC = (SP) 

(2) SP = SP + 2 

rN は，間接 アドレスで もよ い . JSR (A) は， A レジスタ にある アドレスの サ 
ブルーチンにジャンプ する.この場合は， A レジスタが サブ ルーチンへの ポイン 
夕であり ， C a 語では，正規の使用法である. 

3.6 ラ ベ ル 

第 1 カラムから書かれた 1 字から 8 字までの文字列に，ひとつの コロ ンが続く 
ものをラベルと定義する（命令 名 やレジスタ名 JMP ， ADD, A, B, SP, コロン， 
などはラベルとして使わない）.アセンブラがラベル 名（コロ ンは除く）をみつけ 
ると，ラベルをそのラベルに続く最初の命令のアドレスと置き換える.このよう 
に，メモリ中の実際の位置を求める必要はない. JSR の例では，次のように書け 
る. 

J S R s ub r 

subr : RET 

JSR 命令中の subr は，自動的に RET 命令のアドレスと置き換えられる. 
アセンブラは，シンボル•テーブルを使ってラベル名を維持する.アセンブラ 
がラベル名を発見するたびに，ラベル名とそれに関係するアドレスをシンボル. 
テ_ブルに登録する.ラベルが使用されるたびに，シンボル.テーブル内にその 
名前を探して，それに関連するアドレスでラベルを置き換える.たいていアセン 
ブラは前方参照（さきほどの例のように，ラベルが定義される前に使われるよ 


3.8 疑似命令と静的初期化 
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うな場合）を処理するために2回プログラムをみる. C 言語のシンボル•テーブ 
ルは，もつと複雑であるけれども， C コンハ。イラもシンボル.テーブルを使用する. 

3.7 コメン ト 

1行の中で，セミコロンの後にある文字は，すべてアセンブラから無視される. 
コメントは，プログラムが何をしているのかを，別のドキュメントに書かないで， 
同じプログラム中で説明するのに使う. 

3.8 疑似命令と静的初期化 

ある予約語は，アセンブラに，コード生成以外のことをするように伝える役目 
を行う.これらの予約語は，疑似命令と呼ばれる.なぜなら，それらは命令のよ 
うな形をしているけれども，本当の命令ではないからである.疑似命令 

Label: DB N 

は，アセンブラに1バイトのメモリを確保させ，数 N に初期化し，そのバイトのア 
ドレスに対するラベルをつくる （ DB は define byte を表す）.つまり，命令を出力 
するのではなく，数 N をメモリに入れるのである. 

label : DW N 

は，1バイトではなく，1ワード確保する. 

C 言語には， static のオブジェクトの初期化文は，次のように DB か DW を生 
成する. 


static int romeo ; / * romeo : DW 0 */ 

static int juliet ; / * j ulie t : D W 0 * / 

romeo = 5; / * MOV.W U 5 , romeo * / 

juliet = romeo ; / * MOV.W romeo # juliet */ 

この初期化された メモリ 領域は，命令コードといっしょに ディスク 上に保存さ 
れる. プログラムが，オペレーティング•システム によって メモリ 上に 口ー ドさ 
れるとき（つまり，実行されるとき），初期化され ている データは正しい値を 持っ 
て メモリ 中の正しい位置に読み込まれる.この初期化を行う命令コードは生成さ 
れ ていない.デー タは，正しい初期値を 持って， ただ ディスクから 読み込まれる 
だけで ある.これは，サブ ルーチンが 最初に実行されるとき だけ，その サブルー 
チンに ローカル な 静的変数が初期値を 持ってい る理由を説明して いる. この変数 
は，いったん変更されると新しい値を保持する.この動作は，明確に初期化され 
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3. アセンブリ言語 


ていない静的変数が，0に初期化される理由も説明している.プログラマは，セ 
ルを何かに初期化しなければならない. 


3.9 練 習 


3-1 


3-2 


3-3 


2章で述べたアルゴリズムを使用して， A レジスタと B レジスタに保持さ 


れている8ビットの数をかけ合わせて，結果を C レジスタにおくプログラ 
ムを書きなさい. 

文字列を移動する アセンブリ 言語の プロ グラムを書きなさい • A レジスタ 
は文字列の最初の文字のアドレスを含んでいる • B レジスタは文字列のバ 
イト数を含んでいる. C レジスタは，文字列が移動される領域のアドレス 
を含んでいる.もとの文字列と移動後の文字列は，重なっても構わない- 
この場合， もとの文字列は修正されるが，移動後の文字列がもとの無修正 
の文字列を含んでいる. 

次のプログラムで，すべてのレジスタ （ SP と PC は含まれるが， FP は含 
まない）の内容を表示しなさい. 

( a ) JSR 命令の直前. 

( b ) ラベル subr に続く MOV 命令が実行される直前. 

( c ) RET 命令が実行される直前. 

( d ) HALT 命令が実行される直前. 

すべての命令は2バイトで，最初の命令はメモリ100番地にあるとしている. 


MOV 

#100 , SP 

MOV 

#0, A 

MOV 

A , B 

ADD 

#10 ,B 

MOV 

B , C 

SH し 

3 ,C 

MOV 

C # D 

ADD 

B,D 

NOT 

D 

JSR 

HALT 

subr 

MOV 

A ,-( SP ) 

MOV 

B ,-( SP ) 

MOV 

C ,-( SP ) 

MOV 

D ,-( SP ) 

MOV 

( SP)+,A 

MOV 

( SP)+,B 

MOV 

( SP)+,C 

MOV 

RET 

( SP)+,D 


プロセッサを止める 


4 コード生成とサブルーチン結合 


本章では，前章で学んだアセンブリ言語の使用をすすめる. C 言語のサブルー 
チンの呼出しとハ。ラメータの受渡しを，サブルーチンの中からどのように変数を 
アクセスするのかをみながら，より詳細に調べる.そしてフロー制御文を理解す 
るために簡単なコード生成について述べる. 

引数の受渡しの規則をよく知っていれば，再帰呼出しや不定数の引数を持った 
サブルーチンを書くのに役立つ.変数が，内部でどのように配置されているのか理 
解していることはとても重要なことであり，デバッグでたいへん貴重な手助けに 
なる.実際，バグのなかには，それを知らなくてはみつけることがほとんどでき 
ないものもある. 

4.1 サブルーチンの呼出し 

このセクシヨンでは，制御がサブルーチンに渡されるとき生成されるコードに 
ついて述べる.コンパイラに生成された実際のコードはもっと複雑だが，ここで 
の例は重要ないくつかの概念を説明するのに役立つだろう. 

最初に，いくらか基礎知識を必要とする.本章では実行時 （ run - time ) とコン 
パイル時 （ compile - time ) ということばを使用する.コンパイラが動いて，コード 
生成が行われている間をコンパイル時という.コンパイル時にすることが多いほ 
ど，プログラムが実際に実行している間（実行時）にしなければならないことは 
少なくなる.例えば，定数式（数だけで，蛮数を含まない式）は，評価するため 
の情報をコンパイラがすべて持っているから，コンパイル時に評価されるべきで 
ある.このように，命令コードを用いて式を評価する必要はないから，プロダラ 
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4. コード生成とサブルーチン結合 


ムは，コンパイルをするためにわずかな時間を必要とするだけで，よりはやく動 
作する.例えば，式 x = (1024*3) は，1024に3をかけるために必要なかなり 
の量のコードを生成しないで，ひとつの命令 MOV . W #3072， x を生成する. 

前の章では扱わなかったレジスタについても述べる.フレーム•ポインタ•レ 
ジスタ （ FP ) は，スタック•ポインタ （ SP ) と同様に，スタック上のメモリ. 
アドレスを保持している.しかし， SP はセル単位の参照が変化する（プッシュ 
とポップのたびに更新される）が， FP はスタック上の大きな領域への参照が固 
定している.フレーム•ポインタは，サブルーチンの変数を維持するために使わ 
れる.すべてのローカル変数は，サブルーチンに入ったとき（実行時）つくられ 
たひと固まりのブロック内のスタックに維持される.サブルーチンの引数も変 
数と同じメモリ.ブロック内のスタックに保持される.このメモリ.ブロックは， 
サブルーチンのスタック•フレームと呼ばれる.そして，フレーム.ポインタは， 
スタック•フレームとして構成されるさまざまなメモリ領域を参照するのに使用 
される. 

スタック •フレームは， サブルーチンに入るときつくられる.そして，サブル 
ーチンからもどるとき（プッシュとポップに似たやり方で）消去される.したが 
って，メモリ（スタック）の同じ領域を，さまざまなサブルーチンが実行すると 
き にいつ も再利用する.つまり， いくつかの サブルーチンがそれぞれの口 ーカル 
変数用に，スタックの同じ部分を使用する. 

しかし，すべての変数がスタック上にあるわけではないので複雑である.特に， 
レジスタ変数はレジスタにおかれる.広域変数（サブルーチンの本体の外で宣言 
されている）は，はっきり予約語 static で宣言されたロー カル変数のように，固 
定されたメモリ番地にある.スタック上にある変数は，自動変数 （automatic 
variables auto 変数)と呼ばれる. 

図 4.1 に，短い C プログラムとそれに対応するアセンブリ言語を示す.一見す 
るとこのプログラムは複雑そうだが，心配する必要はない.本章の残りでそれを 
理解すればよい. 

プログラム 自体を深くみてみる前に，図 4.1 の行 M にある foo () への呼出 
しを例にして， プログラムが 行う動作をみてみよう.まず， foo () 用のスタッ 
ク •フレームが つくられる.スタック •フレームの 半分は，呼ぶ方のサブルー チ 
ン（この場合は main ()) によってつくられ，後の半分は foo () 自体がつくる. 


4.1 サブルーチンの呼出し 
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A : 
B • 


l nt pi 

=1, p 2 

= 2, p 3 = 3; 

C : 


f oo ( pi , 

p 2, p 3 

) 

D : 

E : 


i n t 

pi , p 2. 

P 3； 

F : 



i n t 

v 1 ,v 2 , v 3 ; 

H : 



return 0; 

I : 
J : 


> 



K : 


m a i n () 



L : 


i 



M : 



foo C pi , 

p 2, p 3 ); 

N : 


> 



1: 

- Pi : 

DW 1 


； static グローバル変数 pi,p2, p3 にメモリを確保 

2: 

-p2： 

DU 2 


； する. 

3: 

4 : 

-P3： 

DW 3 



5; 

_f 〇〇 : 



；スタック.フレームの設定. 

6 : 


PUSH FP 


! フレ_ム.ポインタの待避 

7: 


MOV . W 

SP , FP 

I 新しいフレームの設定 

8: 
9 • 


SUB . U 

#6, SP 

； 口一カル変数のメモリを確保 

10 
11 


MOV . W 

#0, D 

；返り値の設定 

；前のフレーム.ポインタの回復 

12 


MOV . W 

FP , SP 

； ローカル変数の消去 

13 


POP FP 


； 前のフレーム.ポインタの回復 

U 

1 C 


RET 



1 J 

16 

: _ma 1 n : 



；スタック•フレームの設定 

17 


PUSH FP 


； フレーム•ポインタの待避 

18 


MOV . W 

SP , FP 

； 新しいスタック.フレームの設定 

19 


SUB . W 

#0, SP 

； 口ーカル変数はない 

20 





21 




；サブルーチン ”foo(pl,p2, p3) : ” の呼出し 

22 


PUSH _p3 


； 最右のパラメータ （p3) をブッシュ 

23 


PUSH _p2 


； 中央のハ•ラメータ （p2) をプッシュ 

24 


PUSH _p1 


； 最左のハ*ラメータ （pi) をプッシュ 

25 


JSR 

_ f 00 

; サブルーチンを呼びだす 

26 


ADD . W 

#6, SP 

； スタック上の引数を消去する 

27 





28 




;前のスタック.フレームの回復 

29 


MOV . W 

FP , SP 

；口ーカル変数の消去 

30 


POP FP 


; 前のフレーム.ポインタの回復 

31 


RET 




図 4.1 C ブログラムとアセンブリ言語 


main ( ) は，スタックにプッシュして引数を foo ( ) に渡す. この プッシュされ 
た引数は，スタック. フレームの 最初の部分にある.引数は右から順にプッシュ 
される （ p 3 が最初にプッシュされる）. C 言語では，すべての変数の受渡し（配 
列は除く）は値で行われることに注意するべきである.つまり，変数 p 3 自体で 
はなく， p 3 の値が foo ( ) に渡される.別の見方をすると， main ( ) が p 3 の内 
容をスタックにプッシュして， p 3 の コピーをイ亍う. この やり方だと， foo ( ) が 
p 3 に対応する引数を変更しても，実際にはもとの変数自体は変更されずに，変数 
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のコピーが変更される.変数がプッシュされた後のスタックを図 4.2 に示す • 


スタック： 


1 



1 _ ' 
1000: | 

1 

<-SP 

1 __ 

1002: | 

2 

foo () につくられたスタック•フレ 
—ムの一部. 

もとの蛮数の内容がここにコピーさ 
れている. 

1 - 

1004: | 

3 

1 _ - 

1006: 1 


メモリのどこか 

(多分スタック上）： 

1 



1 

100: pi : | 

1 

もとの蛮数 pl ， p 2, p 3. 

1 -- _ 

102: p 2: | 

2 


1 

104: p 3: | 

1- 

3 



もとの pi , p 2, p 3 の値（内容）はスタック上にプッシュされる.そのアドレスは簡単に不さ 
れている.まだ main () に制御はある 

図 4.2 スタックにプッシュされた foo () へのバラメータ 


次に，サブルーチン foo () が呼びだされる.この呼出しはスタックにリター 
ン•アドレスをおく （よくわからなかったら，前章の JSR と RET 命令を復習す 
るとよい）.この新しいスタックが，図 4*3 に示されている. 



1 


1 

• | 

998: 

1- 

| 'J 

ターン•アドレス 

| <-SP 

-1 

1000 : 

1- 

1 

1 

1 

1 

- 1 

1002: 

1- 

1 

2 

1 

1 

-1 

1004: 

1 

1 

3 

1 

1 

-1 

1 -- 

1006: | 

サブルーチン foo () 

に人っているか％ 

1 

1 

まだ命令コード 


はまったく実行していない. 

図 4.3 foo () に入った直後のスタック 


foo () が最初に行うことは，現在のフレーム.ポインタをプッシュして，そ 
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れを保存することである.それから現在のスタック•ポインタをフレーム.ポイ 
ンタにコピーする.図 4.4 はコピーした後のスタックを示す. 


996 

1 1 

1-1 

1 前のフレームポインタ I く- SP <-FP 

998 

1 一- | 

|リターン•アドレス | 

1 _ | 

1000 

1 1 | 

1002 

1- 1 

1 2 | 

1004 

1 - -1 

1 3 | 

1006 

図4 ■ 

1 1 

| 1 

4 フレーム.ポインタを待避した後のスタック 

次に， foo () は自分の口ーカル変数にメモリを割り当てる.このメモリはス 

タック.ボインタから適当な大きさの定数をひいてスタックから得られる.図 4* 

5にメモリを割り当てた後のスタックを示す. 

1 

1 

一 _ _ I 1 

1 

990: | 

1 

992: | 

1 <-sp | 

- | } 口 — カノレ変数 用 

1 1 

I I 

1 

994: | 

- -- | 1 

1 J 

1 

996: | 

前のフレームポインタ | く- FP 

1 

998: | 

リターン•アドレス | 

1 

1000: | 

- - - - | 

1 | 

1 

1002: 1 

1 

2 | 

1 

1 

1004: | 

1 

3 | 

1 

1006: 1 

図 

—__ — - | 

1 

4 - 5 スタック•フレームの残りがつくられる 


この時点で，スタック•フレームが完成する.しばらくの間，この構成がどの 
ように使用されるかをみることにする.そして，サブルーチンからもどるとき 
何が起こるかみてみよう. foo () は自分でつくったスタック•フレームのすべ 
ての部分を削除しなければならない.口ーカル変数は，フレーム•ポインタの現 
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在の値をスタック.ポインタにコピーし，スタック•ポインタがフレーム•ポイ 
ンタと同じ場所をさすようにして削除される（図 4*6 を参照）.次に，フレーム. 
ポインタには，図 4.7 に示されるように，スタックから前の値がポップされて再 
格納される.それから foo () は RET 命令を実行し， main () にもどって，ス 
タックからリターン.アドレスをポップする.スタックは現在， foo () が呼ば 
れる前と同じようにみえる（図 4. 8をみよ）. 

ここで， main () は引数に関連したスタック変数を捨てる.呼びだされたサ 


990: 

1 1 

1-丨 

1 1 

スタックとフレーム.ポインタ 



に同じメモリ番地をささせて， 

992: 

1 1 

変数を削除した 

994: 

1 1 

1 1 


996: 

1-1 

|前の フレーム ポインタ| C-FP 
| | 

<-SP 

998: 

| -- - -- | 

|リタ_ン.アドレス | 

1 _ _ I 


1000 : 

| -- | 

| 1 | 

1 _____ _ _ I 


100 2 : 

2 | 


1004: 

1- 1 

| 3 | 


1006: 

1 - 1 

1 1 



図 4.6 口ーカル変数の削除 



1 


1 

I 

998: 

1 - 

|リター 

ン•アド L 

1 

/ス | く- SP 

1 

1000: 

1 —… 
1 

1 

1 

1 

_ 1 

1002 : 

1 _… 
1 

I _ 

2 

1 

1 

- - 1 

1004: 

1 

1 

3 

1 

1 

— 一 1 

1006: 

1 

1 


1 

1 


まだサブルーチン foo () にいる 
図 4. 7 前のフレーム•ポインタをポップで回復する 
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1 

1 

1000 : 

1 

1 

? I <- SP 

1002: 

1 

1 

? 1 

1 

1 004 : 

1 _■ 
1 

? 1 

1006: 

1 — 
1 

1 

main ( 

) に 

もどってきたところ 

図4 . 8 

foo ( 

) からリターンした後のスタック 


ブルーチンに渡した引数は main () では使用されないから，スタックからポッ 
プしてもとの変数にわざわざもどすことはない.したがって，サブルーチンが他 
のサブルーチンに使用された変数を直接変更する方法はない（直接ではなく，ポ 
インタを使用して間接的に変更することはできる）•この変数はスタック•ポイ 
ンタに数をたして削除される.つまり，図 4.8 に示すようにスタック.ポインタ 
に6を加えて，アドレス1006をさすようにし，その結果引数が削除される（引 
数は3ワード•サイズである • 3*2 バイト= 6バイト）. 

少しもとにもどって，このすベてのプッシュとポップを行う命令コードをみて 
みよう.命令コードはコンパイル時に生成され，コンパイラは始めから終わりま 
で1度その部分を通過するだけである.いいかえれば，コードは入カラインがあ 
ると生成される.サブルーチンが呼ばれる順番（実行時）は最終的なプログラ 
ムに現れる順序に関係ない. main () が最初に実行されるサブルーチンであるか 
らといって，最初に生成されるコードであるとか，目的モジュールの始めにおか 
れる命令コードであることを意味しない. 

図 4.1 の下の部分をみると，コンパイラが名前を変更している（先頭に下線を 
加えている）ことに気づくだろう.コンパイラはしばしば，サブルーチンを呼ん 
で複雑な動作（スイッチにある何かの捜索や浮動小数の乗算）を行う.これらの 
サブルー チ ンは，コンパイラの メーカー から実行時ライブラリとして供給されて 
いる.コンパイラは，それらのサブルーチンは利用できると仮定して，それらの 
サブルーチンの呼出しを生成する.すでに定義されているこれらのサブルーチン 
の名前には，下線で始まるものはない.同様に，実行時ライブラリで使われてい 
る外部データには，名前が下線で始まるものはない.コンハ。イラは，実行時ライ 
ブラリにすでにあるものと決してかちあわないように，読者の変数に下線を加え 
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る.この付加された文字はリンカから出力されるリンク.マップでみることがで 
きる （コンパイラの 中には下線以外の文字を使用するものもある.また，先頭で 
はなく他の位置に文字を付加する コンパイラ もある）.さらに， C プログラムか 
ら呼びだされるアセンブリ言語のルーチンを書くときには，アセンブリ言語にこ 
の付加された文字を加えなければならない （ C プログラムには必要ない）. 

次に static 変数のメモリ割当てをみてみよう.図 4.1 の1〜3行目は C のソ 
ー ス • プログラムの A 行をみて コンパイ ラが生成した.これらの変数は，広域変 
数である（これらはサブルーチンの外で宣言されている）から， DW 命令を使っ 
て固定したメモリ位置に割り当てる • p3 が DW 命令の一部で 3 に初期化されて 
いることに注意しなさい.前章でも述べたように， static 変数の初期化には命令 
コードは使われない. C 言語の2つの基本的な記憶クラス， static と auto は， 
根本的に異なるやり方で扱われる. static 変数はすべて固定したメモリ位置にあ 
る.それで， DW 命令でメモリを確保する.後でみるように， auto 変数は違った 
やり方でつくられる. 

さきに進んで，サブルーチンの呼出しをみてみよう.図 4.1 の M 行にあるサ 
ブルーチン foo( ) への呼出しがアセンブリ言語のプログラムの 22 〜 26 行目を 
生成する.引数はスタックでサブルーチンに渡されることを思いだしなさい.ス 
タックに引数をプッシュすることと，呼びだされたサブルーチンからかえった後 
でスタックを消去するのは，呼びだしたサブルーチンの責任である（この手続き 
は，サブルーチンに不定数の引数を持たせることができる理由のひとつである. 
呼びだす方のルーチンが，スタックを管理している限り，不定数の引数を持った 
サブルーチンは，前もって引数の数を知る必要はない）.引数は逆の順番（右か 
ら左に， p3 は最初に）プッシュされる. 3 つの引数は，宣言されたグローバル変 
数である.したがって，固定のメモリ位置にあり，そして， 22 〜 23 行目のプッ 
シュ命令で，直接そのアドレスを参照することができる.サブルーチンは，実際 
は 25 行目で呼びだされる. JSR 命令も，リタ_ン•アドレスをスタックにプッ 
シュすることを思いだしなさい. 

foo () からもどってきて （26 行），スタックは呼びだされる前の状態になる. 
コンパイラは， ADD . W #6, SP 命令でスタックから引数を消去する•引数は捨 
てられる.それで引数をポップする代わりに，スタック•ポインタに定数を加え 
る（これは，実際には何も移動しないがポップを繰りかえすことと等しい）. 


4.1 サブルーチンの呼出し 
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状態は，行8の SUB . W (ローカル変数のためにメモリをつくるために使われる 
命令）に似ている.つまり，3つのポップ命令は，スタック.ポインタに6を加 
える（ワード移動であるから）.そして，スタックから取りだしたものをどこか 
へおく.スタックに何も残しておきたくないから， MOV 命令はしないでただ直 
接たし算をする. 

さて，サブルーチン自体をみてみよう. foo () に入るとき，スタック•フレー 
ムの一部は引数をプッシュしてつくられる.フレームの残りをつくるのは呼び 
だされたサブルーチンの責任である.サブルーチン foo () は ソース •プ ログ ラ 
ムでは C 行で，アセンブリ言語では行5から始まる. C , D 行はシンボル.テー 
ブル（後で詳しく説明）に影響する.しかし，命令コードは何も生成されない. 

コンパイラは，1， （ E 行）にあうと，6行の PUSH FP で前のフレーム•ポイ 
ンタを保存する.プッシュの後，現在のスタック•フレーム（いまつくっている） 
に対するフレーム•ポインタが，行7の MOV . WSP , FP で初期化される•現 
在のスタック•ポインタの内容をフレーム • ポインタにコピーしている. 

コンパイラは，行 F で口ーカル变数をみつける.行8にある SUB . W で foo () 
の口ーカル変数のメモリを確保する . SP を6だけ減少させ（これもワード移動 
である.ワードサイズの3イ咅は 6) 0を3つスタックにおくためには3 PUSH 
#0命令を使うこともできるだろう.しかし，口ーカルの auto 変数は，サブルー 
チンに入るとき意味のない値であるから，3つプッシュを使うより， SUB 命令 
でスタック•ポインタを直接操作したほうが効率がよい. SUB . W は，スタック 
上にロー カル蛮数用のメモリをつくる.スタック•ポインタを安全な場所（ロー 
カル変数の下方）に移動するだけである. 

サブルーチンが呼ばれるごとに，スタック上にローカル変数用のメモリをつく 
り，リターンする前にそれらの变数をクリアする.このように，メモリの同じ 
領域（スタック）がさまざまなサブルーチンの口ーカル変数に繰りかえし使用さ 
れる. 

foo () の本体は，行 H にあるたったひとつのリターン文からなる•一般的に， 
値は呼出しをしたサブルーチンにレジスタでかえされる. foo () は，行10の 
MOV . W #0, D 命令で呼出しをしたルーチンに〇をかえす.リターン•レジス 
夕には，必ず何かがおかれている.それは， return 文がサブルーチンに書かれて 
いるかどうかには関係ない.呼びだされた関数が値をかえさないときには，リタ 
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ーン.レジスタに保持されているものは意味がない.かえされた値が有効なもの 
であるか， 呼出しを したルーチンが 知る 手立てはないから，ひとつのサブルーチ 
ンに複数のリターン文があるときは危険である.それらのリターン文のひとつが 
有効な 値を かえさない（引数を持たないリターン文を実行する）のならば，意 
味のない値が時にはかえされることになる.同様に，はっきりリターン文が書か 
れていないならば，そのサブルーチンの，が実行されるとき暗黙にリターン文 
が実行され，その暗黙のリターン文は意味のない 値を かえす . C では，すべての 
サブルーチンが値をかえすことに注意する必要がある.呼びだしたサブルーチン 
が返り 値を使用し ないならば，その時は返り値が 実際 意味のないものであっても 
たいしたことではない. 

実際にリターンを行うのに必要な命令コードは，図 4.1 の12〜14行目につく 
られている.サブルーチンは，もとの状態（サブルーチンに入るときの）にもど 
されたスタック•ポインタとフレーム.ポインタを持って，呼出しをしたサブル 
—チンにかえらなければならない.これが12〜13行目で行われている.フレー 
ム.ポインタ （ FP レジスタ）の現在の内容をスタック•ポインタ （ SP ) に移動 
することでスタックがもとにもどされ，スタック.ボインタはグローバル変数がつ 
くられる直前の状態になる.次に，フレーム•ポインタが POP ( FP ) でもとの状 
態にもどされる.最後に，行14でリターン•アドレスを PC にポップして，呼 
出しをしたルーチンにもどる. 

4. 2 スタック•フレーム 

図心1の行6に達したときの計算機の状態を図 4.9 に示す（書かれているアド 
レスは短縮形である）. 

繰りかえすことになるが，サブルーチンに使用されるスタックの一部がそのサ 
ブルーチンのスタック.フレームである.そして，フレーム.ポインタ.レジス 
夕 （ FP ) は固定された場所を参照し，スタック•フレーム内の変数をアクセス 
するために使用される.フレーム•ポインタは，スタック•ポインタと同様に， 
スタックのある場所のアドレスを保持し，引数はいつもフレーム•ボインタから 
計算されたオフセットにある.例えば，サブルーチン呼出しの最左にあるパラメ 
一夕（この例では pi ) は，フレーム.ボインタから+4のオフセットにある. 
(図 4*9 を見直しなさい.前のフレーム•ポインタが，現在の FP から+0の 
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レジスタ 


1 -- 
SP : 1 

1 _ 

102 

1 

FP : | 

108 


スタティック，メモリ 
アドレス：| 


-pi 500: | 1 

I- 

-p2 502: | 2 

I- 

_p3 504: | 3 

I- 

_ f 〇〇 5 06: | foo の： 3— ド 

I の始まり 


スタック： 




アドレス： 

I 

| フレーム.ポインタ 



| 

からの オフセット 


100: 

1 

| (バィト）： 


102 : SP- 

1- 

> | v3 

_ 1 

| -6 1 


104: 

m 2 

_ 1 1 

| -4 } 3 口ーカル変数 

1 | 


106: 

vl 

1 1 
| -2 j 


108: FP- 

1- 

> | 古い FP 

" 1 

| 0 


110: 

1- 

|リターン•アドレス 

. | +2 


112: 

pi 

1 +4 ] 


114: 

P2 

|+6 } 3引数 


116: 

p3 

1 1 

|+8 j 


118: 

古い FP 

1 



1- 

-| ローカル変数はない 


120: 

|リターン•アドレス 

1 


122: 

1--- 

| argv 

~ 1 ) 

1 1 



1- 

-1 } 2引数 


124: 

1 argc 

1 1 


126: 

1- 

1 

- 1 J 

1 



foo ( ) のスタック 
フレーム 


mairu ) のスタック 

フレーム 


図4 • 9 スタック•フレーム 


オフセットにある）.ノヽ。ラメータは，このオフセットによってアクセスされる. 
例えば，パラメータ pi は 

MOV.U 4( FP) , rN 


で f 00() からフェッチされることができる. p 3 は 

MOV.W 8(FP),rN 

命令でフェッチされる.口ーカル変数も，フレーム•ポインタからのオフセット 
を使って参照される.このときは負の方向である.ローカル娈数 p 3 は 


MOV . W 


-6( FP) , rN 
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で foo () の中から参照される.再び図 4.9 を参考にして， vl は FP から一2の 
オフセットに， v 2 は一4のオフセットに， v 3 は一6にオフセットにある.さま 
ざまな変数や，引数のフレーム.ポインタからのオフセットは，それぞれの型 
によ っ て異なるので注意が必要である.つまり long int はただの int よりもスタ 
ック上で大きな変位をとる.引数の大きさは，2か所で計算されることに注意 
するべきである • 1回は呼出しをするルーチンで，もう1回は呼びだされるルー 
チンで行われる.呼出しをしたルーチンで宣言されたパラメータの型 ( int , long , 
float 等）は，コンパイラにスタックにプッシュするのに何バイト必要かを示す. 
呼びだされるルーチンのパラメータ並びの中の対応する引数に宣言された型が， 
コンパイラに特定の引数がフレ_ム•ポインタから何オフセットに発見されるか 
を示す.コンパイラは，これら2つの宣言が同じであるかどうか判断しない.そ 
れで，呼びだす方のサブルーチンが， long サイズのものをスタックにプッシュし， 
そして呼びだされるルーチンが， int サイズのものを要求しているならば，すべ 


foo () が期待するスタック： 


グローパル変数 pi が 4 八イトの long 
integer に宣言されたならば，つくら 
れる スタック： 
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図 4. 10型の不整合によってできたスタック 
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てのオフセットは正しくない.そして，その間違ったものに続く引数は正しく 
アクセスできなくなる.この状態が図 4. 10に示されている.ここでは， フレー 
ム. ポインタからの負のオフセットは正しい（期待どおりに， ローカル 変数 vl ， 
v 2, v 3 がさし示される）.しかし，正のオフセットは正しくない.パラメタ p 2 
をアクセスするのに使用されるオフセット+6では，パラメータ pi の上位ワー 
ドをさし示している . p 3 に対するオフセット （+8) で p 2 をアクセスする • p 3 
はアクセスされない. foo () は前の フレーム. ポインタの値を+1〇とみなして 
いる. 

スタック上に十分な数の引数がプッシュされなければ，もっと重大な問題が 
起こる.この状況を図4.11に示す.再び， foo () が宣言されたとき pl ， p 2， 
p 3 に対するオフセットが計算される.そして， foo () はそれらの変数が正しい 
オフセットにあると予定している•もし foo () が引数を持たずに呼びだされ 
たら，そのとき pl ， p 2, p 3 はスタックにプッシュされていない.しかし foo () 
は引数がそこにないことを知らない.これらの変数が使用されないならば，その 


foo () が期待するスタック： 


foo () が引数を持たないで誤って呼 
ばれたとき，つくられたスタック： 


フレーム •ポインタ フレーム •ポインタ 

アドレス： からのオフセット： アドレス： からのオフセット： 
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図4 • 11十分に引数が入れられなかったスタック 
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4. コード生成とサブルーチン結合 


変数がなくても問題ではない.しかし，もし，ハ。ラメータ p 2 が foo () で更新さ 
れるとしたら，コンパイラはフレーム•ポインタから+6のオフセット （ p 2 が 
本来あるべきところ）にあるメモリを更新する命令コードを生成する.正しい方 
(左）のスタックをみれば，正しい位置にある p 2 をみることができる.間違った 
方（右）のスタックをみると，フレーム.ポインタから+6のオフセットには呼 
出しをするサブルーチンに必要なリターン•アドレスを保持している.これが変 
更されると， foo () が正常に動作し return を行った（呼びだしたほうのサブル 
ーチンも正しく動作した）とし，呼びだしたほうのサブルーチンが return しよう 
とするとき，リターン•アドレスは foo () によって上書きされていて，呼びだ 
したサブルーチンはメモリの他の場所にあるように指示されている.これは，バ 
グが 実行 されてからでないとわからないから， 発見す ることがかなり 難し いバグ 
である.異常の場合は，スタックにあるものが何でもでたらめに変更されてしま 
う.モラルとしてサブルーチンに渡す引数の数をかぞえ，型を確かめるべきで 
ある.または ， lint (読者よりは間違いを起こさない）を使用する必要がある. 

最近の C コンパイラの多くは，ファンクション•プロトタイピングというサブ 
ルーチンに渡す引数の型と数をチヱックする機構をサポートしている.ファン 
クション.プロトタイピングは，型の並びを含んだ extern 文で起動される.例 
えば 

extern double f 〇〇 ( int , char *, long ); 

は foo () が double をかえすサブルーチンであることをコンパイラに知らせる. 
これは， int , char へのポインタ， long の型の3つの引数を持つ.コンハ。イラは， 
指示されたパラメータ以外のもので foo () を呼びだしているのをみつけると警 
告メッセージを生成する.不定数の引数を持った関数 （ printf () など）は，型 

の並びの後に省略符号をつけて規定する. 

extern void prin t f ( char *,...)； 

ここで， printf () は最初の引数として char へのポインタをおく.その後に 
はさまざまな型の引数が続く.ファンクション•プロトタイピングは，デバッ 
グの時間を減少させる.もし，読者のコンパイラがサポートしているのなら，そ 
れを使うことをおすすめする. extern 文は，たとえ同じファイル内にサブルーチ 
ンの宣言があつたとしても，ファンクション•プロトタイビングを動作させるの 
に必要である. 



4.2 スタック•フレーム 
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最後のスタックに関連した問題は，スタック.オーバーフローである.いまま 
でみてきたように，すべての auto 変数はスタック上に維持される.ローカルな 
配列用のメモリもはっきりと static を宣言していなければ，スタックから割り当 
てられる（すべての static 変数はスタック上ではなく，メモリに固定して割り当 
てられる）. 10 K バイトの auto の配列が，サブルーチンに宣言されていると， 
そのサブルーチンのスタック.フレームは，スタックを10 K バイトより少し越 
えて使用するだろう.一般には，スタックに10 K バイトも使えない.まずいこ 
とにコンパイラは通常このことを知らない.結果として，スタックはよくプログ 
ラムのデータ領域，そしてひょっとすると命令コードの領域にも拡張してしま 
う.その配列の内容を変更すると，十中八九他のルーチンのデータや，または悪 
くすると命令コードを変更することになるだろう.繰りかえしいうけれども，こ 
のバグは，悪さをしたサブルーチンからリターンした後長いこと現れない，それ 
で，やはり 発見す ることが難しい. 原則は， 大きな配列は 全部 static にするか， 
malloc () と free () を使って専用のメモリを得ることである. 

読者はいまごろ，スタック•フレームは危険なのに，どうして使うのかと自問 
しているところかも知れない.使用するのにはいくつか理由がある.第1に，前 
にいったように，スタック•フレームを使うと異なる変数に同じメモリを再利 
用できるので，効率的な RAM の使用ができる.必要とする最大のスタックの大 
きさは，入れ子になるサブルーチンのもっとも上のレベルに対応する.第2に， 
スタック.フレームなしでは，再帰呼出しのサブルーチンを書くことはできない. 
8章で，再帰呼出しのルーチンがどのようにスタックを使うかより詳しくみるだ 
ろう.最後に，多くの引数がスタックにどのようにおかれているか，そしてその 
引数の大きさをサブルーチンに知らせることができれば，不定数の引数を持つサ 
ブルーチンを書くことができる. 9章では，不定数の引数を持つ printf () が， 
どのようにこの作業を行うか調べる（引数の数を決定するために，フォーマット 
中の％記号の数をかぞえ， 型を 決定するための 変換文字を 調べる）. 

スタック使用の別の結果を図 4.9 に示す.コード生成に関しては， main () も 
他と同様にひとつのサブルーチンである. main () に特別なものは何もない. 
main () は， foo () のようにスタック•フレ_ムを設定し，そしてもとにもど 
す同じコードを生成する•もっとも厳密にいえば ， main () はスタック•フレー 
ムを必要と しない (実際， main () についてひとつだけ特別なことは，リンカが 
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4. コード生成とサブルーチン結合 


main () の存在を要求することである）. 

main () のスタック.フレームの一部は引数 agrv と agrc である.これらは， 
root モジュールから渡される . main () が， argv と argc を使用しないつもり 
ならば，それらは main () のパラメータ.リストに宣言する必要はない.引数 
のプッシュとポップは，呼出しをするルーチンの仕事なので，外部の引数の存在 
は全く問題にはならない.いいかえれば，サブルーチンが呼びだされる（そして 
main () がそのサブルーチンである）とき，その引数はスタックにプッシュされ 
ている.コンパイラは，ただそのサブルーチン呼出し文の一部である引数の並び 
をみて，必要なプッシュ命令を生成する.引数はスタック上にあり，呼びだされ 
たルーチンに使用されるかされないかには関係ない.しかし，呼びだされたルー 
チンは，そのサブルーチン宣言の一部である引数並びに，それらの引数がなけれ 
ば，引数を得ることはできない.コンパイラが，サブルーチン宣言の正式な引数 
並びを処理するときに，フレーム.ポインタからのオフセットを計算する.呼出 
しのときではない.サブルーチンの呼出しと，サブルーチン宣言の間にはコンパ 
イル時のつながりはない.つながりは実イ亍時までできない. 

スタック•フレームに関する問題とまとめてみると 
( 1 ) スタック上にプッシュされた引数が，正しい型であるのか呼びだされたサ 
ブルーチンは知る方法がない. 

( 2 ) 呼びだされたサブルーチンは，呼出しをしたルーチンが正しい数の引数を 
スタックにプッシュしたのかわからない.ただ，引数がちゃんとしたとこ 
ろにあると仮定している. 

(3) ルーチンは，引数がスタックにいくつあるか，その型は何か，知ることが 
できれば，不定数の引数を渡されることができる. 

4.3 サブルーチン呼出しにキャスト ( cast ) を使う 

変数を特定の型にしておくことは，その変数をサブルーチンに渡すときには必 
ずしも都合がよくない.それで， C はキャストという有効な演算子を与えている. 
キャストは，変数や定数をサブルーチンへ受け渡すようなときのために，その変 
数や定数を他の型に変換するようコンパイラに指示する.キャストは，かっこで 
囲まれた型の定義のようなものである.キャストはどのように行うか示すと，ま 
ず希望の型の変数宣言（後にセミコロンはつけない）を書き，その定義をかっこ 
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で囲む.そうして変数名を消し，キャストで変換したい変数の名前を後に書く. 
例をみてみよう. 

f 〇〇 ( Iongvar ) 
long Longvar; 

て 

> 

main 


> 

ここで， main () は foo () を呼びだして intvar を渡したい. intvar の方は int 
である.しかし， foo () は型 long を期待している.示したように foo () への 
呼出しを 実行 すれば，さっき述べたスタックにアライメントの 間違いの 問題を つ 
くる.この問題は， intvar を long にキャストすることで回避できる.キャストを 
書くには，まず long の通常の定義を書く. 

long x ; 

次に，セミコロンを消してその定義をかっこで囲む. 

(long x) 

最後に，変数名を消す. 

(Long) 

それで，たった今つくったキャストを， invar の前におくことによって，（ス 
タックにプッシュする前に） invar を long に変換するよう コンパイラ に知らせる 
ことができる. 

f 〇〇 ( ( long) intvar ) ; 

コンパイラによっては， int と long は同じサイズのものもある（例としては， 
VAX と68000のコンパイラの多くは int も long も32ビットである）.さきのプ 
ログラムは，これらの計算機ではキャストなしでも正しく動作する.しかし，他 
の計算機に（同一計算機の他のコンパイラに）移動しようとしても，動作しない 
だろう.読者のプログラムを互換性のあるものにするつもりならば，たとえいま 
は不必要なものに思えてもいつもキャストを使うべきである. 6章で，ポインタ 
について述べるときに再びキャストについて検討する. 


int intvar; 


f 〇〇 ( intvar ); < - 誤り 
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4. コード生成とサブルーチン結合 


図 4 • 12 図 4 . 1の 行 B を処理 中のシンボル.テ_ブル 


4. 4 返り値 (return value) 

スタック.フレームに関連した問題のひとつに，サブルーチンの返り値がある. 
返り値は，通常レジスタで呼出しをしたルーチンにもどされる.呼出しをしたル 
—チンは，このレジスタには有効な値が入っていると想定している.すべてのサ 
ブルーチンは値をかえす，しかし，その値は，明示された return 文で正しくレジ 
スタに入れられていなければ，ごみがかえされる（呼出しをしたサブルーチンが 
この値を使わなければ，この値がごみであっても問題はない）•こういう理由で， 
複数の return 文を使うことはよい考えではない.サブル_チンは値:をかえすなら 
ば，明示した return 文を経由しないそのサブルーチンからの他の通路がないか確 
かめるべきである. 

4.5 シンボル • テーブル (symbol table) 

コンパイラは，メモリ内の変数の位置を記録するために，シンボル.テーブル 
を使用する.静的，またはグローバル蛮数の場合は，絶対アドレスのメモリにあ 
る.口ーカル変数の場合，それらはフレーム.ポインタからの，あるオフセット 
の位置にある.シンボル.テーブルはコンハ。イル時に使用される.シンボル.テ 
—ブルの要素は，コンパイラが宣言にあったときに登録され，変数がもはや必要 
なくなったときに削除される.例えば，ローカル変数が宣言されたときにテーブ 
ルに入れられ，コンパイラがサブルーチンを処理し終わったら削除される•図 4. 
12にシンボル.テーブルを示す.これはコンパイラが図 4.1 のプログラムを処 
理しているときの様子である. 


値 


型 


名 

数 

変 


0 2 4 
〇 〇 〇 




定定定 
固固匡 




12 3 
p p P 




コンパイラは，3つの宣言しかみなかったので，3つの変数だけが示されてい 
る.クラスは変数の記憶クラスである.変数が固定したアドレスにおかれていれ 








4.5 シンボル . テーブル （symbol table) 


99 


図4 . 13図4 • 1の行 E を処理中のシンボル.テーブル 


サブルーチンである f 00 は，固定したメモリアドレスにある.その型は，返り 
値の型である.いま，変数 pl ， p 2, p 3 に対して3セット登録されている.その2 
番目の登録（テーブルの5〜7行目）は， foo () の引数並び（行 C と D ) にあ 
る3つの変数である.コンパイラが変数を使用するときには，テーブルを下から 
上に探し，該当する名前を持った最初にみつけた登録要素を使用する. foo () 
の中でパラメータ p 2 が使用されていれば，コンパイラはテーブルをさかの ぼっ 
て p 2 を探し，テーブルの6行目で p 2 を発見する.そのときローカル変数 p 2 は， 
同じ名前のグローバル変数より優先される（なぜなら，コンパイラは該当する名 
前を持った変数をみつけたら探すのをやめるから）. C 言語では，すべてのロー 
カル変数は，同じ名前のグローバル変数より優先する. 

さて，もう少しプログラムを処理する.図4，14は， foo () のすベての口一力 
ル変数を処理した後のシンボルを示す. 


ば固定，スタック上におかれていれば自動，外部（異なるファイルで宣言され 
ている）にあれば extern と書かれている.型は変数の型 ( char , int , long 等）. 
サブルーチンの方は，サブル_チンの返り値が適用される•値は，メモリの絶対 
アドレスか，フレーム•ポインタからのオフセットである.これは，記憶クラス 
によって異なる.自動変数はオフセットを使い，固定した変数は絶対アドレスを 
使う.サブルーチンの値は，サブルーチンの最初の命令のアドレスである.現実 
のコンピュータのシンボル•テーブルは，ここに示すよりもっと複雑である•し 
かし，基本的なものはすべてこの例の中にある. 

コンパイラが行 E を読むまでに，いくつか変数がテーブルに加えられている. 
新しい状態を図 4*13 に示す. 


変数名 クラス 型 値 


0 2 4 6 
0 0 0 0 4 6 8 


定定定定動動動 
固固固固自自自 
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4. コード生成とサブルーチン結合 


図 4 • 15 図 4.1 の 行 J を 処理 中のシンボル.テーブル 


foo () 自体（つまりサブルーチン名）がグローバル変数として扱われる（グ 
ローバル変数と同じレベルで宣言されているから.すなわち，どのブロックにも 
含まれていないから）ことに注意しなさい • main () が処理されるとき，テーブ 
ルは図4.16のようにみえる. main () は口ーカル変数を持たないので，テーブ 
ルはこれ以上大きくならない. 

ここで注意するべき重要なことがいくつかある.第1に，変数の参照はシンポ 
ル•テーブルを通じて行われる.サブルーチンは，呼出しをしたルーチンが，実 
際にすベてのパラメータをスタックにブッシュしたかどうか知る方法はない.正 
規の引数並びに，いくつかのパラメ ータが宣言されていることがわかるだけで 
ある. 


図4 • 14図4 . 1の行 G を処理中のシンボル.テーブル 


ここで，本当の口ーカル変数（引数と比較して）は，フレーム.ポインタか 
らのオフセツトが正数ではなく負数になっている.コンハ。イラが， foo () の処 
理を終えたとき（つまり，行 I の’！’をみつけたとき）テーブルから foo () の 
すべての ローカル 変数の參照が削除される.それを図4.15に示す. 


変数名 クラス 型 値 


変数名 クラス 型 値 


0 2 4 6 
0 0 0 0 
5 5 5 5 


n n n n 


定定定定 
固固固固 


〇 

12 3 0 
p p pf 


0 2 4 6 

0000468246 
5 5 5 5 + + +--- 


tttttttttt 

nnnnnnnnnn 


定定定定動動動動動動 

固固固固自自自自自自 


123 0123133 

p p pf p p P V V V 
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図4 . 16 図 4.1 の 行 L を 処理 中のシンボル.テーブル 


第2に，変数についてのすべての情報はシンボル.テーブルを逆に探して決定 
される.たとえ他にもテーブル内に同じ名前の変数があったとしても，最初にみ 
つかった変数が使用される. 

最後に，サブルーチン名は，その宣言に出会うまではシンボルテーブルに登録 
されない.コンパイラが，サブルーチンの返り値を知る唯一の方法は，その宣言 
を処理することである.したがって，サブルーチンを宣言するまえに使うと，コ 
ンパイラはシンボル.テーブルにそのサブルーチン名をまだ登録していない•サ 
ブルーチンを使う前に，必ずサブルーチンの宣言をするようにプログラムを書く 
ことはいつも都合がよいわけではないから，コンパイラは少し仮定をする . int 
をかえす extern サブルーチンであるとして，シンボル.テーブルに宣言されて 
いないサブルーチン名を入れる.そのサブルーチンが，同じファイル内に後で宣 
言されていてもたいしたことではない.リンカがそれを発見するだろう. 

4. 6制御の流れ： if / else , while 等 

図4.17に， if / else をアセンブリ言語に変換したものを示す . x と y を static 
にしたのでプログラムは簡単である.条件 （ x > y ) は，3つの命令を必要とする. 
x の値を A レジスタにおき， y の値をひく （A = x - y ) • A レジスタの前の 
内容は破壊される • x が y より大きければ，結果は正で P フラダはひき算の結果 
として1にセットされる. x が y に等しければ，結果は0で Z フラダが1にセッ 
卜される. x が y より小さければ，結果は負で N フラグが1にセットされる. 
JLE 命令は， N か Z フラグが1にセットされているときだけジャンプする . if 
文の条件部分に規定されたのと反対の条件で試して，その反対の条件が真だった 
ら else 節の方にジャンプする.つまり， x > y で調べて ， x く のときだけ 


変数名 クラス 型 値 


0 2 4 6 0 
0 0 0 0 0 


t t t t t 

n n n n n 


定定定定定 

固固固固固 
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4. コード生成とサブルーチン結合 


static i n t 

x ； | x : 

DW 1 

DW 1 

static in t 

y ; 1 y ： 

l f ( x > y ) 

1 

| if: 

MOV.W x f A 

i 

i 

i 

SUB . W y,A 

JLE else 

< 処理 > 

i 

i 

1 

< 処理 > 

else 

1 

i 

| else: 

| 

JMP next 

< 処理 > 

> 

1 

1 

| next: 

1 

図 4 •17 if/else 文 

< 処理 > 


分岐する （ JLE 命令を使用する）.この人り組んだプログラムの仕方によって， 

3つ目の JMP 命令を使わないですむ. if 節は， else 節の前の無条件ジャンプで 
終わる. 

図 4*18 は， while ループを示す.前の例で述べたように，ひき算をしてから 
反対の条件でループの外にジャンプさせて判定する.ひとつ違うことは，条件に 
合わないとき eles 節にジャンプする代わりに，ループの外にジャンプすること 
である. while ループの continue 文は ， JMP while 命令に変換される . while 
ループの break は ， JMP next に変換されている. 


static 

i n t 

X ; I x : 

DW 

1 

static 

i n t 

y; 1 y ： 

1 

DU 

1 

w h i L e ( 

x > y ) 

1 

| while: 

MOV.W 

x , A 

•c 


1 

SUB .U 

y, a 



1 

JLE 

next 


く処理 > 

1 

1 

< 処理 > 




1 

1 

JMP 

while 

> 


1 





| next: 





図 4 .18 while ループ 




for 文は，図4.19に示されている. for のループ部分を処理するために生成さ 
れた命令コードは， while のものと同じであることに気づくだろう.初期化と増 
加させる命令コードが for の場合には加えられている.しかし，さきの例の while 
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s t a t 

c i n t 

x ； 1 

x : 

DW 

DW 

1 

s t a t 

c i n t 

y; 1 

y 

1 



I 

1 


MOV . W 

#0,x 

f o r ( 

x = 0; x 

> y ; x + + ) j 

| 

f or : 

MOV.W 
SUB . W 

x , A 
y # a 



1 


JLE 

next 


< 処理 > 

1 

1 

| 

endfor : 

< 処理 > 



| 


ADD . W 

x,#1 



1 


JMP 

for 

> 


1 

1 

next: 




図 4 . 19 for ループ 


文の前に X = 0 をおき， ループの 終わりに X ++ をおけば同じ命令コードが生 
成されただろう.通常は，ソース•プログラムを読みやすくする制御文を使う. 
目的コードは，多分同じになるだろう. 

for ループの continue 文は， JMP endfor 命令を生成する.一方 for ループの 
break は， JMP next に変換される. 

文 for( ; ;) と while(l ) は” do forever” としてよく使用される.多くのコ 
ンピュータでは，図 4.20 に示すように， for ループに対してもつと効率のよい命 
令コードを生成する. 


w h i L e (1) 

1 

while: 

MOV.W #1,A 



1 

1 


OR.W A,A 

J Z next 


< 処理 > 

1 

1 


< 処理 > 



1 

1 


JMP while 

> 


1 

1 

next: 


f or ( 

；； ) 

1 

1 

1 

f or : 



< 処理 > 

1 

1 

1 


< 処理 > 

> 


1 

1 

図 4 • 20 

無限ループ 

JMP for 


while(i) は， whiled ! = 〇)と比べて同じだと考えられる.！=と明示す 
ると不必要な命令を生成させることになる. 
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4. コード生成とサブルーチン結合 


4. 7 switch 

switch は if / eles よりは複雑である. switch は，ソースコードをみても，コ 
ンパイラが何をしようとしているのかよくわからない， C 言語の2，3ある要素 
のひとつである.さらに，コンパイラは，異なる状況では違ったことをしようと 
する.例として Lattice C コンパイラのパ、ージョン2.14用の マニュアルを 引用 
する ( pp .4-26 f . ;かっこ内は著者のコメントである）. 

コード生成は， switch 文には効率的な命令コードを生成しようと特に努力す 
る. case の値の数と範囲によって，3つの命令コード列のうちひとつが生成 
される. 

( 1 ) case の数が，3かもっと少なければ，制御は条件と分岐命令で case 
の要素へとぶ（つまり， switch は if / else の繰りかえしのように扱われる）. 
(2 ) case の値がすべて正で，最大の case と最小の case の差が case の数 
の2倍より少なければ，コンパイラは， switch の値で直接指示される分岐表 
を生成する.値は，必要ならば，最小の case の値に調節されて，指標づけ 
するまえに表の大きさと比較される.この構造は，最小の実行時間と，3番 
に記述されるタイプのものに要求されるのより小さい表を必要とする. 

(3 ) 上記以外であれば，コンパイラは [ case 値と分岐ア ドレス ] が対にな 
った表を生成する.これは， switch の値を順に探す（この処理は，よく使用 
される case が表の終わりにあると，特に，非効率である）. 

コンパイラの 中には，すべての switch を最適化しないで， （3) の 場合として 
扱うものもある.これは switch をひどく非効率的にしてしまう.他の コンパイ 
ラには，バイナリ•サーチができるように case 値の表を再構成して， （3) の場 
合をもっと効率よくしているものもある.このように， switch の最初の case 文 
の位置は， case が最初にみつかったところであるとは限らない.しかし， if/else 
の if 文は，いつも最初に評価される （ case が評価される順序と，計算機が該当 
する case に制御を移した後の命令コードが実行される順序とを混同すべきでは 
ない）. 

これらすべてが意味することは， switch はとても非効率的になりうるというこ 
とである.ひとつか2つ else 節があるくらいで， if / else の代わりに switch を 
使用するべきではない•その一方で， switch は長々と続く if / else よりもしばし 


4.8 再配置可能プログラム (relocatable code ) 
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ば読みやすいプログラムができる. 

4. 8再配置可能プログラム （relocatable code ) 

明確にするために，いままで述べてきたプログラムは，すべて再配置可能では 
なかった.再配置可能プログラムは2つの属性を持っている.メモリ中のどこで 
も走らせられなければいけない.そして，他のモジュールとリンク可能でなけれ 
ばならない. 

プログラムを再配置可能にするには2つの方法がある. 8085のような計算機で 
は，絶対アドレスのジャンプしかサボートしていない（つまり， JMP 100とは 
書けても JMP 124( PC ) とは書けない）から，仮アドレスの仕組みを使う•コ 
ンパイラは，コンパイル時にジャンプに目的のアドレスを与えることができない 
(なぜなら，コンパイル時に，処理中のモジュールがメモリのどこにおかれるか 
わからないから）.したがって，コンパイラがアセンブリ命令をつくるときに， 
通常は目的のアドレスを入れる場所に，アドレスそのものではなく，目的のアド 
レスへのオフセットを入れる.このすベてのオフセットがプログラムに入れられ 
た位置を示す表を保持している.外部オブジェクト（このモジュールに宣言さ 
れていないサブルーチンやデータ）と，外部オブジェクトがプログラム中で使わ 
れている位置を示す別の表がある.その位置は，通常外部オブジェクトをアクセ 
スする各命令へのそのモジュールの先頭からのオフセットである. 3番目の表は， 
外部からアクセスすることができる，現在処理中のモジュール内にあるすベての 
オブジェクトを記載している.予約語 static は，グローバル変数に使うと，その 
変数を3番目の表に含ませない.したがって，静的グローバル.オブジヱクトは， 
リンカがアクセスすることはできないので，そのオブジェクトが宣言されている 
ファイルの外からアクセスすることはできない.リンカは，最終的なプログラム 
にまとめるときに，もとのプログラムの不完全な部分を解決するためにこれらの 
表を使用する.リンカは，外部オブジェクトへの参照を，その実際のアドレスと 
置き換える.そして，そのときはモジュールのべース•アドレスはわかっている 
から，ジャンプ命令のオフセットも同様に絶対アドレスに置き換える.リンカへ 
の入力となる中間モジュールは，再配置可能である.しかし，最終的な（リンク 
された）プログラムは，再配置可能ではない.メモリ中の特別な領域でだけ走る 
ことができる. 
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真の再配置可能なプログラムは，相対アドレスをサポートしている計算機 (68000 
や PDP -11 のような）上でだけ行われることができる.この場合，絶対アドレ 
スへのジャンプや絶対アドレスのメモリ•アクセスなどはつくらない.むしろ， 
すべてのジャンブは現在のプログラム.カウンタと相対的に行われる [JMP 
x ( PC )]. 外部サブルーチンへは通常，2回のジャンプでアクセスされる.命令 
コードは，モジュール内の既知の位置にあるジャンプ.テーブル（ジャンプ命令 
の長い表）へのジャンプが生成され，それから，リンカがプログラムをリンクす 
るとき適切な相対アドレスを含むジャンプ.テーブルに修正する.外部データは， 
データ領域（リンカによって供給される）のべース•アドレスに相対的にアクセ 
スされる.このように，2番目の形態のプログラムはメモリ中のどこにでも配置 
することができる. 


4. 9練 習 


4-1 前章で述べたアセンブリ言語を使用して，次の ソース •プログラムをみて 
コンパイラが生成するようなアセンブリ言語プログラムを書きなさい .int 
は2バイト占めるとする.呼びだされた関数の返り値はレジスタ D で呼出 
しをした関数にかえされる. 


test( var 1 # var2 ) 
int var 1, var ビ ; 

て 

int x, y ; 

x = v a r 1; 
y = v a r 2 ; 


w h i l e ( x < y ) 

x = x + y; 


i f ( x 
else 


>=3 ) 

return( x + 

return 0 ; 


y - 


static int a, b; 

a = 2; 
b = 3; 


test( a, b ); 


4.9 練 
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4-2 練習 4-1 にあるサブルーチン test () の，スタック•フレームの図をかき 
なさい.スタック•ポインタとフレーム•ポインタ，そしてフレーム•ポ 
インタからの関連するオフセット全部を示しなさい（図 4*9 のように） • 
4-3 上記の図を使用して，次の処理の後シンボル•テーブルがどのようにみえ 
るか示しなさい. 

( a ) test () にある intx , y ; が処理された. 

(b ) main () モジュール中の test () への呼出しが処理された. 

4-4 読者のコンパイラに使用されているスタック.フレームがどのように構成 
されているか記述しなさい. auto 変数と，サブルーチンの引数がどのよ 
うにアクセスされるか説明しなさい.読者のコンパイラが，サブルーチン 
のアセンブリ言語のダンプをつくるのならば，それを含めること. 









5 構造化プログラミングと 

ステップワイズ • リファインメント 


構造化プログラミングとは，組織だった維持しやすいプログラムを書くための 
テクニックに対してつけられた一般的な名称である.本章では，構造的な方法で 
のプログラムの書き方をみる.さらに，書式やプログラムの編成の仕方，そして 
コメントづけのような周辺の問題も検討する.本章は，構造化プログラミングの 
話題には少しだけ触れて，多くは構造化プログラミングのテクニックが，小さな 
プログラム（2000行以下）を開発するための使われ方について述べる.この話 
題は読者が思うよりも役にたつだろう. 

構造化プログラミングのテクニックは，ときどき，” goto 文のないプログラム 
を書くこと”といわれている.しかし， goto 文を使うか使わないかは，よく構造 
化されたプロダラムを書くのにはたいした問題ではない. goto 文があってもよい 
プログラムを書くことができるだけでなく， goto 文がないプログラムより読みや 
すかったりもする.構造化プログラミングは，思考過程を整理してプログラムを 
開発するひとつの方法である.そのために，プログラムは開発時間が短くてバグ 
が少ない. 

残念なことに，多くの学校では，この構造化プログラミングの授業を，情報処 
理教育課程以外の学部生徒に使っている.結果として，構造化プログラミングと 
いう言葉は，サークルによっては悪い評判を得てきた.多くの人が，実用的でな 
い机上の練習のような構造化プログラミングを知る.その人達は，構造化プログ 
ラミンダをただのたいへんな作業の形のかわったものとしてとらえ，学部生徒の 
生活をより忙しくすることを意味している.真理にまさるものはない.プログラ 
ムが構造的な方法で開発されるとき，多くのプログラムは，より少ない時間で書 


no 
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かれ，もっと信頼性を高くすることができる. 

構造化プログラミングのテクニックは， C 言語でプログラムするときには欠く 
ことができない.言語の中には， Pascal や Modula -2 のように，言語の構文とし 
てプログラム構造を組み込んでいるものもある.構造化されていない Pascal プ 
ログラムを書くことは（書こうと思えばできないことはないけれども）難しい. 
一方で， C 言語は，言語自体に組み込まれた厳格な構造はない. C 言語は，プロ 
グラム編成と開発方法に大きな自由度がある.したがって， C 言語に加えて構造 
化プログラミングも学ばなければ，自分をプログラムの穴に落として，動かず， 
直すこともできない40000行のプログラムの中で自分を探すことになるだろう. 

5. 1プログラムを書〈ことは作文である 

プロダラミングと数学が，どこか関係があるというのは一般的な誤解である. 
ここでは，情報処理科学 (computer science ) とプログラミングとを，すなわ 
ちプログラムの研究とプログラムを書くこととを区別している.情報処理科学の 
多くは，数学的な解析をしなければならない.一方，数学者でなくとも，よいプ 
ログラマになることは可能である.数学でないならば，何がプログラミングの基 
礎を与えるのだろうか？ プログラムを書くテクニックは，随筆を書くテクニッ 
クとほとんど同じである.英作文の授業で学んだ技術が，プログラミングに応用 
されるとき，とても価値がある（多くの学校で，情報処理科学の単位として作文 
を（数学と同様に）必要とすれば，プログラムがもっとよく書けるばかりでなく， 
読みやすいドキュメンテーションも書けるだろう）.本章では，構造化プログラ 
ミングについて話すための手段として，随筆を書く メカニズムを使うつもりであ 
る.話がすすむにつれて，その2つの過程を比較する. 

随筆を書く最初の，もっともたいへんな段階は題目を決めることである.広い 
分野を，有効なスペース内で，十分に議論することのできる主題に狭める.いっ 
たん題目を選んだら，それについてよく調べ，他の人のいったことを学び，そし 
て他の人の仕事と，もとの起源を調べて自分自身の結論を書く.要約すると，随 
筆を書く最初の段階は考えることである. 

不幸にも，考えることはプログラム開発ではたいてい忘れられている段階であ 
る.問題の解決方法に論点を絞るまえに，随筆の題目を書くことができる範囲に 
狭めなければならなかったように，その問題を正確に定義しなければならない. 


5.1 プログラムを書くことは作文である 
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プログラムを書きながら，問題を明確にしようとするのは誤りである.どの未解 
決の問題も事前に考えられていなければいけないし，不慮の出来事も考慮されて 
いなければならない.もちろん，この段階ですベてを考えることはできない.し 
かし，試みることで膨大な作業から自分自身を救うことができる.そうしなけれ 
ば，プログラムを書くことに時間を費やすことになるだろう.その場合，仕事は 
進まないし，修正することも困難になるので，そうならないようにするべきであ 
る. 

問題が定義されたら，その問題についてよく調べ，他のプログラマが同様の問 
題をどう解いたか調べる.この段階もよくとばされる.プログラマは，しばしば 
もうすでに解決されている問題に何時間も費やす.この時間は，以前の解決法を 
調べることを面倒がらなければ必要なかっただろう. 

関連した問題だが，多くのプログラマは他の誰かが書いたプログラムを使用す 
ることを嫌がるということがある.そんな方法は嫌だというだけですでにできて 
いるプログラムを無視しようとしないこと.確かに，プログラムの中にはひどく 
まずい形式で書かれていたり，しばしば多くの人に修正され，使わない方がよか 
ったり，草稿から始めたほうがべストであることもある.しかし，動作している 
プログラムを見捨ててしまう前に，公平に，同じ程度のプログラムを自分で書 
くとどのくらいの時間がかかるのか，そして自分のプログラムのほうがそれより 
本当によくなるのか算定しなければならない. 

随筆の中で述べることを決めたら，実際にそれを書かなくてはならない.同様 
に，プログラムの課題を決めたら，そのプログラムを書かなければならない•た 
とえすわって随筆を書き始めたとしても，思考のつながりのないページで終わっ 
たら，随筆というより，とりとめのない読みにくい雑文になってしまうだろう. 
同様に，ただすわってプログラムを書き始めることはできない.まずプログラム 
の構成を考えなければならない.随筆を書くときも，プログラムを書くときにも 
アウトラインを決めることが第1ステップである.実際，普通のアウトラインの 
形式がプログラム設計によく適している. 

アウトラインを書くにはどうするのか？ 整然とした形で考えを展開させる. 
書こうとしていることを2, 3の簡潔な文で要約し，とても 高いレベルで 問題を 
定義することから始める.これらの文を1行にひとつずつ紙に書き，各文に口一 
マ数字を割り当てる.プログラム設計に使われる過程も同じである.数行の簡潔 
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な文で，問題をどのように解くつもりか要約する.実際それをやってみなさい•文 
章にして紙に書きなさい.問題をことばに置き換えることは大変重要である•そ 
れを文章にできないのなら， C 言語で表すこともできないであろう. 

短いけれども具体的な例をみてみよう.次のサブルーチン （8 章にある）が与 
えられたとする. 

int pa r se( exp r ) 

char expr []; 

このサブルーチンは，算術式を含む文字列を入力とし，その式を評価し整数の 
結果を出力する.このプログラムぐらいの，小さな計算プログラムをつくりたい. 

プログラムを書くまえに，そのプログラムがするべきことを定義しなければな 
らない.この定義は，随筆の題目を段落に分けることに等しい.記述は簡潔だが 
可能なかぎり完全であるべきである.次の各段落は記述として好ましい. 

8章にあるサブルーチン parse () を動作させるプログラム expr を書きな 
さい.そのプログラムは，算術式を解析して結果を標準出力にプリントする. 
式は10進数で，かっこと加算，減算，乗算，除算に対する+, — ，*，/か 
らできている.式中に空白とタブは認められない.インフィックス記述 ( 訳注 2, 
(infix notation ) が使用される. 

プログラムの呼出しは3つの形式がある. 


expr 

は標準入力から1行に式1づずつ連続して得て，それらの式を評価し，結 
果を標準出力にプリントする.すべての式は改行で終わり，それは式の一部 
とはみなされない. 

expr <exp 1> ...<expN> 

はコマンドから式 （ expN ) を抜きだして，それらを評価し，式とその結果 
を標準出力にプリントする.各引数_ 3 、こは，式がひとつだけあり，引数の 
式は完全なものでなければならない. 

expr - f < if 1 Ie > 

は，入力がコマンドからでなく，指定されたファイルからである以外は，前 
の形式と同じように動作する.そのファイルは1行につきひとつの式があ 


訳注2 :通常の計算式の書き方である.（例）10+2 = 12 
訳注3 :式 （ expN ) は expr を呼びだすときの引数 
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る（最初の例と同様）. 

プログラムは入力した式を，計算した結果といっしょに，標準出力にプリ 
ントするべきである.式が評価できないときには エラーメッセージを だす. 
繰りかえしモードで式が演算子で始まっているときは，前の評価の結果を 
現在の式の最左の項として使う（式の最初の項として，負数を使う必要があ 
るときは （一1) を用いる） • 

次の段階は，データがどのように表されるかを決めることである.データの型 
の選択が，しばしばプログラム全体の構成に影響する.それで，この決定をはや 
くすることがもっともよい.この例は，2つのタイプのデータを必要とする.式 
を保持するためのバッファと，解析結果を保持するための変数である. 2つの 
井 typedef と# define でデータを定義する.これは， expr . h というファイルに 
入れられる（図 5*1 参照）. 


#define MAXBUF 128 

typedef char BUFFER[ MAXBUF ]; 
typedef int ANSWER ; 

図 5 .1 Expr . h 


このファイルは，プログラム中のすべてのファイルに含まれている（プロダラ 
ムが複数ファイル構成になった場合）.このプログラムで使用されているすべて 
の定数は，マクロにするべきである（図 5.1 の MAXBUF のように）.このよう 
にすると，入カ バッ ファの大きさをかえるときには， MAXBUF マクロを訂正し， 
数字で書いた定数を探すために，すべてのソースファイルを調べなくても再コン 
パイルすることができる. 

第3の段階は，記述したものを単純な動作に書き直し，これをアウトラインの 
形式にすることである.プログラムのアウトラインは図 5.2 に示されている. 


I . もしコマンド行に引数がないならば 

A . 式を会話的に処理する 

II . その他（コマンド行に引数がある） 

A . もし最初の引数が 一 f であるならば 
1. ファイルからの引数を処理する 

B . その他 

1. コマンド行からの引数を処理する 
図 5.2 簡単なブログラムのアウトライン 
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もちろん，このアウトラインではとても短い随筆と，とても短いプログラムに 
なる.しかし，アウトラインにはまだプログラムを書くには十分な情報がない. 
図 5.3 のように，アウトラインを少し詳しくする. 


I . もしコマンド行に引数がないならば 

A . 式を会話的に処理する 

1 . 開始のメッセージをプリントする 

2 . 人力がある間 

a . プロンプトをプリントする 

b . 入力行を得る 

c . 式を評価する 

i . もし式が演算子で始まっているならば 

(a ) 前の演算結果をその式の最左の項として使用するために式の文 
字列を修正する 
(b ) 式を解析する 
(c ) もし エラー があったら 

(i ) エラー . メ.ッセー ジをプリン トする 
( ¢1 ) その他 

(i ) 結果をプリントする 

II . その他 （コマンド 行に引数がある） 

A . もし最初の引数が 一 f であるならば 
1. ファイルからの引数を処理する 

a . ファイルをオープンする.もしオープンできなかったらエラー.メッセ 
—ジをプリントする 

b . 入力行がある間 

i . 式解析ができるように人力行を修正する 
ii . 式を評価する 

B . その他 

1. コマンド行からの引数を処理する 
a . 引数がある間 

i . 式を評価する 

ii . 次の引数を得る 
図 5- 3アウトラインを詳細にする 


式の評価は，3つの場所 （ I . A . 3. c . ， I . A .1. b . ii ， II . B .1. a . i ) で行わ 

れることに気づくだろう.今，同じことをしているのに気づいて，ひとつのサブル 
—チンが，実際全部の式の評価をするために使用されるプログラムを書くことが 
できる•前もってこのような決定をすることは，できあがったプログラムを修 
正するより簡単である. 

随筆に話しをもどす.随筆全体を要約する段落から始めなければならない•そ 
の 要旨説明 ( 訳注心の段落は，アウトラインの主な項目をまとめることでできるだ 
ろう. C プログラムでは，要旨説明の段落に等しいものが main () サブルーチ 
ンである.ちょうど要旨説明の段落がつくられたように， main () もアウトラ 


訳圧4 : topics paragraph 
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アウトライン 

| ブログラム： 




| - - _ -- -- 
1 

| m a i n ( a r g c , 

argv ) 



1 int a r g c ; 
j char *argv 
1 { 

c ]; 


I . 

j l f ( a r 

gc <=1) 


I . A 

| interact ive_mode(); 


I I . 

| else 

| i 



I I .A 

| l 

f( argc = = 3 && argv[1][0]== 1 - 

'&& argv [1][1]=='f') 

I I • A • 1 

1 

file_mode( argv [2]); 


I I . B 

| e 

l se 


I I • B •1 

1 

| > 

command-mode(argc, argv ); 



| > 




図 5.4 アウトラインからプログラムへの変換 


インから組み立てられる（図 5.4 参照.プログラム自体が理解できなくても心配 
することはない.ただ，プログラムの構造をみればよい）.プログラム中の入れ 
子の深さ ( 訳注 5 > が，正確にアウトライン中の入れ子の深さと対応している. 

要旨 説明の段落は，それ自体が小さな随筆として成り立つべきであり，同様に 
プログラムでもそうあるべきである.開発中のプログラムは，開発のおのおのの 
段階で十分に機能するべきである.したがって，プログラム開発の次の段階は， 
それを動作させることである.これを行うためには， stub と呼ばれるいくつか仮 
のサブルーチンを与えなければならない. stub はその存在を宣言するだけで何も 
しない.しかし， main () はサブルーチンを呼びだすから，それらのサブルーチ 
ンは main () をコンパイルしてテストするときに，存在しなくてはならない. 
図 5*5 に main () を動かすために必要な stub を示す. 

stub は，ただ ” I’m here ” とプリントしてリターンする.簡単にできれば， 
引数もプリントする.このやり方で，有効な引数がサブルーチンに渡されたか 
どうかがわかる.あきらかに，この点では stub プログラムは多くのことはしな 
い.それにもかかわらず，プログラムを十分にテストし動かすことができる（役 
立つことは何もしないかもしれないが，動作を行っている） • 10 000行のプログ 
ラムを書いて，それを一度にデバッグしようとするのは誤りである.代わりに， 

2，3行のプログラムを書き，それが動くようにして，さらに2，3行書いてまた 
それが動くようにする.そしてそれを繰りかえすべきである.内容の変更は， 一 

訳注 5 : プログラムのみた目のでこぼこの具合，インデント 
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interactive_mode() 

printfC Doing interactive i n p u t \ n "); 

> 

flle _ m o d e( filename ) 
char * file n a m e; 

printfC'getting input from <%s>\n", filename ); 

> 

command-mode(argc, argv) 
char * * a r g v; 
int argc ; 

printfC doing command mode i n p u t \ n "); 

> 

図 5 . 5 main に使用される stub 


度に2， 3 個しかしなければ，プログラムが止まったとき，問題のある位置がい 
つで もわかる. 

随筆にもどる.もうパラグラフを付加して随筆に肉付けをしなければならない. 
そのひとつひとつのパラグラフはアウトライン内の副主題のひとつの題材を取り 
あげる.さらに， main () を書くために使ったのと同じ手順で stub を展開させ 
て プログラムを詳述することができる.この詳細にしたプログラムを図 5*6 に示 
す. 


アウトラメ 


.A . 1 
.A . 2 


プログラム： 


//include <s td i 〇 . h> 
#include "expr . h" 


isopr ( c ) は c が演算子* +—/ の中のひとつであったら 1 に評価する. 


#define is 〇 p r(c) (( c )==' 


11(c) 


II (〇 


I I <〇 


interactive_mode( 


interactive mode で式を処理する.プロンプトをプリントし，標雖人力から式を 
得る，そして結果をプリントする.実行は EOF か空行にあつたら終了する. 


BUFFER buf ； 

printf("Enter expression after ? or <CR> to exit prog 「 am\n" 
w h i l e (1) 
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.B . 1 .a . 
• B . 1 .a 


f 1 l e_mode( Tname 
char * f n a m e; 


/* 


フ丁イルから得た式を評価する.そのフ T イルは読みだし專用モードでオーブンし 
ていて，一度に1行ずつ処理される.行が’/ n ’ （改行）で終わっていたら，改行 
は削除される.行の最大の長さは MAXBUF —1(132) 文字である. 


BUFFER buf ; 

FILE * s t r e a m ; 

if( (stream = fopen(fname,"r")) == NULL ) 

fprintf(stderr, "Can't open <%s>\n", fname 

else 

w h i l e ( fgets(buf, MAXBUF, stream) != NULL ) 

/* 復帰コードを削除して式を評価する. 

* 空行は無視する.空行を評価しない. 


I en(buf )) && *buf 

+ — Ien) == ' \ n ') 


if( *(buf 
* < buf 


l en) 


eva l ua te( buf 


command-mode(argc, argv) 
char **argv; 


/ * argv から傅た式を処理する . evaluate () が呼ばれる前に1回にひとつ argv は 
* 增加させられていなければならない （ argc を減少させて相殺する）. 


evaluate 
a r gv + + ; 


-argc >= 0 ) 
argv 


図 


6 stub を詳細にする 


今は evaluate () という stub ひとつだけが必要である（図 5.7). stub の e - 
valuate () は，プログラムの残りが適切に動作するかどうかを示す値をもどさ 
なければならない. 

ときには新たな改良版をコンパイルし，そして動くようにする.また詳細を書 
く作業を続け，アウトライン全体を通して，一度にひとつのセクションを処理し 
ながら小さなプログラムと いく つかの stub を書き，できあがったプログラムを 
動くようにして，ブログラム全体が終わるまでこの過程を繰りかえす.プログ 
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1 n t 


eva l uate( expr ) 

printf("Evaluating <%s> # returning 1 \n", expr ); 
return 1; 


図 5 . 7 evaluate () に対する sutb 


ラム開発のためのこの方法は，ステップワイズ•リファインメント （stepwise 
refiement ) と呼ばれ，構造化プログラム開発の心臓部である.その主な利点は， 
プログラムがどの段階でも動作し，それでどこか悪いときにも必ず問題を発見で 
きることである. 

随筆を書くとき一度にひとつの段落を書くように，一度にひとつの stub を書 
くことは重要である.再 コンパイル する前に，ほんの少しだけ変更することは 
退屈なことのように思えるかもしれない.しかし，長い目でみると時間の節約に 
なっている（なぜなら，ぐあいが悪い時に，バグがありそうなところがいつもわ 
かるためである.バグは変更したばかりのところにある）. 


アウトライン 


I • A • 2 . c 

I I . A . 1 .b 
11 • B • 1 .a 


プログラム： 


int evaluate( expr ) 
char *expr; 

static i nt def_val 
i nt err ; 

BUFFER copy ； 


= 0； 


expr に含まれてぃる式を評価して結果をプリントする. expr の最初の文字か演算子乞 
らば，务の式の缎初の艰として def val を使用する（つまり . evaluate () への刖 
の呼出しで生成された結果を使う）.もしエラ—があつたら，結果の巧^丨）にラフ— 
メッセージをプリントする.いずれにしても， parse () にかえされた値をもとす''ェ 
ラーのときは0である）. 


I . A . 2 . c . 1 
I • A . 2 • c • i 


a 


I . A ■ 2 ■ c • i 

I . A . 2 . c . i 
I • A . 2 . c • i 
I.A.2.c.i 
I . A . 2 . c . i 


b 


c 

c . i 


d 

d . i 


i f( i sopr( *expr )) 

sprintf( copy, "%d%s", def.val, expr ); 
expr = copy; 

> 

def_va l = parse( expr, &err ); 

if( err ) , 

fpr intf (stderr # 11 Error in expression: %s \ n 11 f expr); 

else 

printf("%s = %d\n", expr ( def_va L ); 
return def_va l ; 


図 5 • 8 evaluate ( ) stub を詳細にする 
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ただひとつ残っている stub は ， evaluate () である . evaluate () は図 5.8 
に展開されている.これ以上他には stub はない. 

5.2 プログラム構成 

随筆の場合と同様に，プログラムはよく構成されていると読みやすくて修正が 
しやすい. プロ グラムを構成する上でよい方法が2つある. 

第1の方法は，随筆を手本にする.随筆は，2, 3行で随筆を要約する要旨説明 
の段落から始める.それから，順序よく話題を発展させ，関連する考えを段落に 
グループ分けする.段落が，考えを述べた要旨説明文で始まり，それからその考 
えを一連の関連した文に発展させた，この構成をうつしだしている.プログラム 
もこの手本に従って，サブルーチンの呼出しを連ねて，プログラムの機能を記述 
した上位レベルのルーチン （ main () のような）で始まる.それらのサブルーチ 
ンは，それぞれふさわしい名前をつけられている.各サブルーチンは，段落に対 
応し，同じようなやり方で展開する.まずそのサブルーチンから始まって，その 
サブルーチンが使用するルーチンが続く. 

このプログラムのやり方を手本にすると，ほとんどの作業を行う上位レベルの 
ルーチンが ファ イルの先頭にあり，そして，その上位レベルのルーチンに呼びだ 
されるルーチンがその下におかれる.サブルーチンは，下に読んでいくにつれて， 
より複雑になり，より下のレベルになる.モジュール内の最初のルーチンは， 
main () である. 

第2のやり方は，随筆全体を逆さにする.最下位レベルのサブルーチンをファ 
イルの先頭におき，そしてその上のレベルのサブルーチンを下におく.サブル_ 
チンは，やはり第1と同じようなやり方で開発する.しかし，開発はファイルの 
終わりから先頭にすすむ.このやり方の利点は，プログラム中に前方参照（まだ 
宣言されていないサブルーチンの使用）が少ししか要求されないことである.し 
かし，本来どちらのやり方が，より優れているということではない.ファイルを 
読みあげるか読みさげるかに関係なく，整然とサブルーチンを示すベきである. 

プログラムのファイルを構成する第3のやり方は，サブルーチンをアルファべ 
ット順におくことである.前方参照の問題は，ファイルの先頭に extern 文を書く 
ことで解決される.しかし，このやり方ではプログラムはかなり読みにくい（サ 
ブルー チンと，その近くのサブ ルー チンとの間に密接な関係がないから）.しか 
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し，アルファベット順のファイルだと，特別なファイルを探すのは簡単である. 

プログラムのアウトラインは，大きなプログラムを複数のファイルに分ける方 
法に ついて よ い 指標を与えてくれる.ローマ数字で印をつけられたサブルーチン 
は，それひとつが •， ひとつのモジュールにおかれる.それは，アウトライン内の 
分類で表されたサポート•ルーチンもいっしょである.機能的に関係するサブル 
ーチンを必要とするこのやり方は，プログラムの全体の大きさによる.しかし， 
この追加のモジュールもアウトラインと同様に構成される. 

その他の構成上の問題は，データの位置や外部宣言などである.筆者はたいて 

い次の順序でモジュールを構成する. 

/^includes 
extern 宣言 
#det 1 nes 
typedefs 

グロ ーバル変数 

実行文 

サブルーチン内に，外部変数と ^ define などを混在させないこと.サブルーチ 
ン内の定義が失われてしまうからプログラムの維持が難しくなる. 

5. 3 コメントのつけ方 （ commenting ) と書式 ( formatting ) 

本章の大部分は”よい助言”の部類に入る.多くの人はコメントをつけるスタ 
イルや書式規則について，ほとんど狂信的な情熱を持って説教する.その人達は 
心得違いをしている.書式の規則はプログラムを読みやすくするためのものであ 
る.そして，この目的以上のことをできるようにする.正反対の立場では，書式 
は一貫しているかぎりたいして重要ではないという人もいる.これは明解だが真 
実ではない.プログラマの書式は，いつもおそろしく大事なものになり得る.こ 
こで述べることのいくつかは，読者は賛成できないかもしれない.しかし，本章 
は，この問題について読者によく理解させることができる.コメントは，すべて 
のプログラムにある基本的な部分である.自分自身を解説しているようなプログ 
ラムはない（よく書かれているプログラムにはコメントは少ないけれども）.読者 
のプログラム本体に，コメントをつけてみよう.別の紙に書いてはいけない（紛 
失しないように）.プログラムに不慣れな読者は，プログラムの文はみないで， 
コメントを最後まで読んで，そのプログラムがどのように動くか，かなりよくわ 
かるはずである. 


5.3 コメントのつけ方 （ commenting ) と書式 （ formatting ) 
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プログラムを書きながらコメントをつけるべきである.さきにプログラムを全 
部書き，プログラムが動くようになってからコメントをつけるのは誤りである. 
ひとつには，とても大きなプログラムは決して完全には動作しない.そのために， 
コメントをつけることはできなくなるかもしれない.ときには，プログラムをデ 
バッグするのがとても簡単でさきに解説をつける必要がないかもしれない•しか 
し，誰もが詳細におぼえている量には限界がある.プログラムにコメント付けを 
することは，プログラムをデバッグする間中，プログラムがどう動くのかについ 
てすベてを思いだす必要から読者を解放する. 

別の考えでは，最後にコメントをつけられたプログラムは，適切にコメントを 
つけられていることがほとんどない.そして，よくコメントがつけられているプ 
ログラムほど維持しやすい • 2年前に書いたプログラムを変更しなければならな 
いとき，適切なコメントがつけられていたらとてもうれしいだろう. 

コメントは，随筆の一部であるかのように，主語，述語，目的語を持ったよく 
整った文章であるべきだ.簡略語や文の断片を使用して，最小になるようにする 
方がよい.正しく几帳面にコメントをつけるべきである.いいかえると，英語を 
使用するルールをコメントでも有効に使用するべきである.そして，コメントを 
プログラムのような，読みにくいものにしてはいけない. 

よい プログラマはよく，プログラムをまったく書かないうちに，コメントをさ 
きに書く.つまり，文章でまずプログラム全体を書き，プログラムの動作の 細部 
をすベて 詳しく 記述す る.それから，コメントにコードを添える.処理をことば 
で 記述す ることは，処理を分類するのに役立つ.考えつかなかった潜在的な 問題 
があきらかになる.したがって， C 言語で書く前に，文章で書いていることを書 
きおろすならば，しばしばよりよいプログラムになるだろう. 

5.3.1 空白 （ whitespace ) とインデント付け （ indenting ) 

適切に分布された空白は，自由につけることができるもっとも有効なコメント 
のひとつである.たいていの平凡な書類にあるように，空白はプログラム中では 
いつも句読点（，；等）の後に続くべきであり，できれば演算子（+，一， * 等） 
を囲んでいるべきである.空行が段落の前にあるように，プログラムは，空行を 
前において，機能的に短くかためて配置されている. while , for , do , switch , 
if 文は，いつも空行が前にくる • else 文は，選考する if 文の一部だから，通常 
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は空行を前におかない.一般的に，空白なしで5, 6行以上は続けない. 

必ず，1行には1文以上は書かない.プログラムを次のように書くべきではな 

い. 

if( 1 s d 1 g 1 1(* s))for(p = s,i=0;is digit(* p);)i+=i*10+(*p + + -'0 , ); 

( プログラムを読みにくくしたり，デバッダできないようにするつもりがなけ 
れば）この例からは，得ることは何もない.この行は，次のように書かれるべき 
だった. 


i f ( i s d i g i t ( * s 〕 


f or( p = s ; 


i s digit(* p ) ; p + + 

(i * 10) + (* p - 


インデントをつけることは空白と関連した問題である.文の本体 （ body ) は， 

少なく とも4 つの空白の イ ンデントを置いている.ここにいくつかの例がある. 

wh 1 Ie( condition ) 
b 〇 d y (); 

for( a; b>c; d + + ) 

て 

body_of_for(); 

> 


if( condition ) 

a c 1 1 o n (); 

else 


another_action( 


)； 


プログラマの中には，空白 4 っのインデントさえ渋々認めたり，ひとっか2っ 
しかあけない人もいる.しかし，空白ひとっのインデントではプログラムは全然読 
みやすくならない. C 言語でプログラムしているのである. BASIC ——余分な 

空白はプログラムの実行を遅くする-ではない.インデントをっけているた 

めにプログラムの右端が書ききれないなら，そのときは，たぶん低いレベルの入れ 
子を独立したサブルーチンにするべきだろう.入れ子が多すぎるなら，間違いな 
く設計の欠陥の印である.プログラムが“ただ大きくなってしまっている”とき 
には起こりやすい.っまり，本当の問題はタブが大きすぎるのではなくて，サブ 
ルーチンが十分に考えられていないということである. 

’} ’， ’1’は，もっとも外側のインデントのレベルであることに注意すべき 
である.これは，対応のない，と’1，をとても簡単に発見させる•っまり， 




5.3 コメントのつけ方 （ commenting ) と書式 (for matting ) 
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定規で線をひくことができる.かっこにインデントをつけているなら，かっこは 
囲んでいる部分に見失われやすい.同様に，読者が次のようにするならば，対応 
しないかっこをみつけにくい（斜めの線をひかなくてはならないし， ， i ’ を見 
失いやすい）. 

w h 1 I e( condition ){ 
code(); 

> 

インデントをつけることはヌル文にも適用する.例えば 

f 〇 r ( c = x ; c ; C + + ) 

i 

ここで， セミコロンは インデントをつけられて，次の行にひとつおかれている. 
for や while 文の終わりの不必要な セ ミ コロンは， 筆者がよ〈おかすエラーであ 
る.例えば 

while( a < b ); 
a + + ; 

> 

は “ a が b より小さい間は何もしない.そして，それを処理したら a を増加させ 
る”ということである.しかし，上のプログラムではそのループは決して終わら 
ない.同様に 

if ( 条件 > ； 

do_something(); 

は“条件が真ならば，何もしない. そして do-something () を 呼ぶ’’.次の行に 
セミコロンをおく ことで，こ の種のエラーを みつけるために grep を 使用するこ 
とができる （1 章参照）.つまり，正規表現 while . * ; は， セミコロンが 後に続 
く 語 while をす ベての 行で探す. for . (. *); は誤った終わり方を している for 
文を探す. 

かっこの おき 方のルールで問題の ないひと つの 例外は do/while 文が次の よう 
に書かれているときである. 

do {. 

code() ; 

> whi le( 条件 )； 

この構成は，たった今述べたバグ（誤っておかれたセミコロン）と while 文に 
正当なセミコロンが続く状況（その行に先行するかっこがあるのなら，そのとき 
は最後のセミコロンはそこに属する）とを区別させる. 
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最後のひとつの問題は，同じページにあるサブルーチンの視覚的な区切りであ 
る.それらのサブルーチンがともに走るなら，それらを発見しにくい.したがっ 
て，各サブルーチン宣言の上に 


のようなダッシュをひいたコメント行をおくことはよい考えである. 

サブルーチン本体の内側や目的（サブルーチンどうしを分ける）に反すること 
に，このようなコメントをおくべきではない.サブルーチン内の主なブロックを 
分けるには2，3行の連続した空行を使うべきである. 

5. 3. 2 コメントの書き方 

C では，コメントを入れ子にできない.次のプログラムを考えてみる. 

コメントはここから始まる 

I 

I 

I 

/* これはきちんと終わっていないコメントです.数行にまたがる 
比較的長いコメントになってしまった. 

w h i I e ( a ) 

a 二 f 〇〇 (); 

/* これは別のコメントです.これはきちんと終わっている.しか 
し，コメントの終わりの文字がみつけにくい . V 

I 

I 

I 

ここで終わり 

このプログラムでは， while ループがコメントの一部になっている.この問題 
は終わりの記号を見やすくするようにコメントを書くことで小さくできる. 2つ 
の例がある. 

/* これはたぶんもっともよいコメントの書き方である.星印が ついてい 

* て，まとまったコメントをすぐみつけられる.このようなコメントは， 

* それがみつけられるブロックと同じ入れ子レベルにいつも書かれるベ 

* きである. 


/ * これは，コメントの始まり （ open - comment ) と * / 

/ * コメントの終わ’） ( close - comment ) の記号がき */ 

/* ちんと縦に並ぶ場合だけはよい. */ 

コメントをでたらめにおいてはいけない.あるいはコメントの記号を右端，ま 
たは左端にそろえて書くこと.これだと簡単で終わりの記号を忘れることがない. 
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5. 3. 3コメントをおく場所 

2, 3のコメントは，読者のプログラムにも必ずあるだろう.ファイルの先頭に 
あるコメントは，ファイル名，そのファイルにあるサブルーチンやプログラムの 
動作内容の簡単な記述，外部から受け人れるすべてのォブジェクト（サブルーチ 
ンとグローバル変数）を与える.筆者は，図 5*9 に示される書式を用いている. 


//include < stdio . h > 


/ * すべての# include がここにくる 



* 

★ 


FILE.C - ファイルが行うことをここに簡潔に書く.必要ならば， 
数行になってもよい. 


外部オブジェクト： 

f 〇〇 ( a , b ) 

1 n t a ; 
i n t b ; 

bare d , e ) 
double d ; 
char *e; 

int GlobaL -1; 


- foo () がすることをここに書く 
- a がすることをここで説明する 
- b がすることをここで説明する 

- bar () がすることをここに書く 
- d がすることをここで説明する 
- e がすることをここで説明する 

- Gloval 1がすることをここに書く 


図5 . 9 ファイルの先頭のコメント 


各サブルーチンの先頭にある同様のコメントが，そのサブルーチンの動作内容 
とサブルーチンの動作レベルはどのくらいか，すべての パラメー タのすることを 
記述しているはずである.すべての口ーカル変数の機能も，コメントに書かれて 
いる.図5.10がその例である. 


void 

int 

int 


f 〇〇 ( 
a ； 
b ； 



int 

char 


/* a がすることをここで説明する */ 
/* b がすることをここで説明する */ 

、のコメントで foo () がどのように動作して，何をする 
のかを説明する. 


i = ふ ぶるる出溫るるン/ 


/* 実行文がここから始まる • 

*/ 

図5 . 10 サブルーチンのコメント付け 


プログラムを書き散らしてはいけない.プログラム文と交互にコメントがある 
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と，コメントなのかプログラム文なのか判読しにく くなる.それはまるで，2冊 
の本を1行ずつ交互に読もうとしているようである.コメントとプログラム文は， 
論理的なブロックにまとめられるべきである.プログラム文のブロックのまえに， 
そのプログラム文が，どのように動作するのかを記述したコメントのブロックを 
おく.その動作が複雑であれば，プログラム文に対応するコメントに番号をつけ 
ることができる（脚注のように）.図5.11がその例である.コメント（” 

等）は， while 文の上の記述にある番号（（1)等）を参照する. 


これは下の while ループ内で行われることを説明する複雑なコ - 
である.そのループは次のように動作する： 

( 1 ) do something の動作内容 

(2〉 do something else の動作内容 

( 3 ) do another の動作内容 


wh 1 L e( condi1 1 on ) 
i 

do_someth i ng( ) ; / * 1 * / 

do_something(); 

do_something_else( ); /* 2 * / 

do_something_else(); 

do_another( ); / * 3 * / 

do-another(); 

> 

図 5.11 実行文のところからコメントを参照する 


5. 3.4 明白なことを説明しないこと 

コメントは，みてすぐにわからないことを教える.次のようなコメント 

tea += 2; /* tea に2をたす */ 

e I i s a ( ) /* サブルーチン elisa 開始 * / 

は役にたたないどころかむしろ悪い.これは，みただけではわからないことを何 

も教えないばかりか，不必要に冗長なページにしている.プログラムを読む人は 

だれもが言語を知っていて，演算子がどう動くか理解していると仮定していれば 

安全である. 

5.3.5 変 数 名 

変数名は，それ自体変数の機能を示すコメントである.変数名は何かを意味し 
ていなければならないし，変数はその機能と同様にそのスコープがわかるように 




5.4 グローバル変数とアクセス•ルーチン 
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つけられているべきである. 

マクロ名 （# define ) は，すべて大文字で書くべきである.グローバル変数の 
最初の1字だけは，大文字にすべきである.口ーカル変数はすべて小文字である. 
このようにすると名前をみることで変数のスコープがわかり，同じ名前のグロー 
バル変数と，ローカル変数を互いに区別できる.変数名の中間の文字を大文字に 
すると，そうした理由を思いだすのが困難になる . 2つのことばを分けるには下 
線 （_) を使用すべきである.それは一貫して行う必要がある. 

変数名は，その機能を表すべきである.さらに，できれば短縮名にしない（短 
縮は読みにくい）.ここでの問題は移植性である•初期の C コンパイラは，変数 
名の最初から8文字を識別のために必要とした.余分な文字は，もしあっても無 
視された.コンパイラは，長い変数名をサポートし始めている.しかし，8文字 
より長い名前を使用すると，さきのコンパイラには移植できない.短縮形にする 
ときは，よく注意する必要がある.自分は理解している短縮形も，他の人にはわ 
からなかったりする. 

コンパイラが長い名前をサポートしていて，アセンブラがサポートしていない 
ならば，マクロを使用してこの問題を回避することができる.例えば 

#define this_is_a_long_variable_name vnl 

this_is_a-long_variabLe_name = 6; 

C 言語のソース.プログラムでは長い変数名を使用できるが，アセンブラはそ 
れを短くして等価なものを読ませる.けれども，この方法は注意を払う必要があ 
る.プリプロセッサの中には，たとえコンパイラ自体が長い文字を受け入れても 
井 define の最初の8文字しかみないものもある.プリプロセッサは，コンパイラ 
の一部ではない. 

5. 4 グローバル変数とアクセス.ルーチン 

どうしても必要なとき以外，グローバル変数は使わない方がよい.使用する場 
合は，グローバル変数は static で宣言し，アクセス.ルーチンを通して外部から 
更新するべきである. 

ここでの問題は，リンカによって起きる.同じ名前の2つのグローバル変数が， 
それぞれ別にコンパイルされるモジュールに宣言されているならば，たいていの 
リンカはそれらを同じ変数だと思ってしまう. 5年前に，ひとつのモジュールを 
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書いてライブラリに入れたとする.そして，それから偶然にもそのライブラリ • 
ルーチン にある名前と同じ名前のグロ ーバル 変数を使用したとする•その変数が， 
時々（そのライブラリが呼びだされるとき）不思議なことに，値がかわってしま 
うのがわかる.この状態は，発見されにくくかつ修正しにくい. 

この問題の解決法は，すべてのグローバル変数を static で宣言することである. 
静的なグローバル変数は，それが宣言されているファイルの範囲に限定される. 
したがって，あるファイルに宣言されたサブルーチンは，別のファイルに宣言さ 
れた静的なグローバル变数をアクセスすることはできない. 2 つの 静的なグロー 
バル変数が同じ名前であっても，リンカはその2つを別の変数として扱うだろう. 

時々ではあるが，他のモジュールからグローバル変数を変更する必要があるこ 
とがある.そして，このためにアクセス•ルーチンかイ吏用される.アクセス•ル 
ーチンは，静的グローバル変数を修正したり取りだしたりするサブルーチンであ 
る.アクセス•ルーチンは，それ自身はグローバルにアクセスできる.図5.12は， 
そのようなルーチンがどう使用されるかを示す.ルーチン setvar () と getvar () 
は，変数 Global _ var アクセスする.アクセス•ルーチンは，7章にある式解析で 
使用される.そこで，よりくわしく討議する. 


ファイル1: 

厂 

| static int Global-var; 

I 

| setvar( x ) 

I int x ; 

I i 

I Global_var = x ; 

I > 

I 

| getvar() 

| < 

| return Globa l _var; 

I > 

I 

| do_something() 

I i 

j /* Global var が ここで 使用され る */ 

| > 

；- 


ファイル2: 


some_func 1 1 on() 

C 

setvar(123); 
do_something(); 
x = getvar(); 


図 5 .12 アクセス•ルーチン 


ファイルを機能的に構成しているならば（そのために同じファイルにあるすべ 
てのサブルーチンは機能的に関連がある），ある特別なグローバル変数を使用す 






5.5 移 


植 


性 
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る全サブルーチンは，たいていひとつのファイルに集められている.したがって， 
実際にはアクセス.ルーチンはあまり必要ではない. 

5.5 移 植 性 

C の長所のひとつは移植性である.普通，マイクロプロセッサのタイプによっ 
て，プロセッサ専用の C コンパイラがある.しかし， C 言語が，移植性がよいと 
いう事実は，必ずしも移植できるということを意味しない.うまく書かれた C プ 
ログラムは，モデムを通して他の計算機にダウンロードし，再コンパイルして， 
少しの労動で実行させることができる.一方，移植性を考えないで書かれたプロ 
グラムは，他のシステムで実行させるには何日もかかるだろう. 

移植性を考えるうえでもっとも重要なことは，たぶん，コンパイラの I / O ライ 
ブラリである. UNIX コンパイラの I / O ライブラリは， C 言語用に事実上標準 
のものを与えていて，多くのコンパイラが UNIX I / O 関数の主なものをサポー 
卜している.読者のコンパイラのライブラリが UNIX コンハ。チブルでなかった 
ら，他のコンパイラを求めたほうがよいかもしれない（少なくとも他のシステム 
にプログラムを移動するつもりなら ）. UNIX Programer’s Manual の Volume 
I (参考文献参照）には，すべての UNIX I / O ルーチンが記述されていて，自分 
のコンパイラの解説書と比較する基本としてたいへん役にたつ. 

コンパイラの中には ， C 言語に役にたつ魅力的な拡張を加えているものがある 
が，それは使用しないこと.同様に，コンパイラのメーカーが供給している標準 
でない （ UNIX ではない）サブルーチンは，そのソース•プログラムがついてい 
なければ，そのようなサブルーチンは使用しないこと. 

ハードウェアについては，何も想定していない.ハードウェアを操作しなけれ 
ばならないルーチンは，ひとつのファイルに集めるべきである.そうすれば，必 
要なとき簡単に変更できる • int が16ビット幅で，ポインタと int が同じ大きさ 
であると仮定してはいけない.図5.13に， int のビット幅をバイト数でかえすサ 
ブルーチンを示す. 

整数の大きさは，時々定数で示される.このため整数の大きさはいつも 

Oxfffe 


よりも 


"0x1 
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w 1 d t h () 



int のビット数をかえす 


register int i, j; 

f o r( j = ~ 0, i =1; j << = 

return i; 

図 5 .13 int のけた数をみつける 


の方がよい. 

さきの式は，32ビット幅の整数では動作しない.同じく，使用するならば 

0x8000 


の代わりに 

_(( (unsigned) ~0 ) >>1) 

を使用するべきである（~0は int だから，ここではキャストが必要である.それ 
で，符号披張は数がシフトしたとき行われるかもしれない.最上位ビットをクリ 
アすることにはならないだろう）.移^€性については，10章でより深く討議する. 

5.6 避けるべきこと 

5.6.1 goto の乱用：非構造化プログラミング 

本当に必要がなければ goto 文は使用すべきではない. goto それ自体，悪いと 
ころはない•多くの状況（いくつもの レベルに いれ子に>なった while や for ルー 
プから抜けださなければならないような場合）では， goto を使用することが，も 
っとも簡潔で効率よくこの問題を解く方法である. C 言語は，ループを制御する 
方法を3つ ( for , while , do ) と，ループの制御の流れをかえたり終わらせたり 
する4つの方法 （ break , continue , return , exit () サブルーチン）を持って 
いるから， goto はめったにプログラムの中で必要とされない. 

goto の乱用は， C プログラムが goto と同じサブルーチン内にあるべきラベル 
を必要とする場合に制限される. goto を使用するための大まかな原則を次に示 
す. 

( 1 ) while , for で， break , continue , return , exit () が使用できるならば 
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w h 1 l e ( • • •) 

i 

w h i l e (...) 

w h i l e ( 


abort : 


an _ unrecoverable_error 
goto abort ; 


clean _ up (); 


図 5 •14 goto の有効な使用法 


goto は使わない. goto 以外のものを使うべきである.だからそれらを使 
用すべきである. 

(2) goto と分岐しようとするラベルが，プログラム•リストの同じページにあ 
る場合のみ使う.そうすれば，制御の流れがひと目でわかる.ラベルは， 
インデントのレベル（図 5.14 參照）にあわせないで，もっとも左のカラ 
ムから書き始めてみやすくする. 

( 3 ) goto に対応するラベルは，必ずそのサブルーチンのもっとも外側のブロッ 
クにある文につながること. if 文から， else 節中にあるラベルに分岐する 
ようなことは絶対にしないこと. 

(4) パニックになるのを避けるために， goto 文の使用は厳密にすること.サブ 
ルーチン内のラベルはひとつだけであること.複数の goto 文からそのラ 
ベルに分岐することはあっても，複数のラベルには絶対に分岐すべきでは 
ない. 

goto に関連する問題は， setjmp( ) と longjmp( ) サブルーチンの呼出しで 
ある. setjmp( ) の呼出しは，現在の計算機の状態をバッファに保存する. 
longjmp( ) の呼出しは setj mp () する前の状態にもどす.これらのルーチン 
は，プログラムの維持管理の悪夢を生みだす.スタック•フレームは破壊され， 
変数はよくわからない状態で発見される.さらに，制御の流れはプログラムを 
みても追跡できないようになってしまう.筆者は，これらのサブルーチンを使 




//define begin 
#deflne end 
#define AND 
/^define OR 
tidei ine Stuff 


下のようにできるからといって，上の define をしてはいけない. 

while (条件 AND 条件 OR 条件） 

begin 

Stuff; 

end 

読者が Pascal でプログラムを書きたいのなら， Pascal を使いなさい. C 言語 
を他の言語と同様にみなすことは，他の言語を知らない C プログラマが，読者の 
プログラムを管理するのをただ難しくするだけである.そのプログラムは必ずし 
も読みやすくはない.ただ，より親しみがあるようにみせているだけである（そ 
れは，たまたま読者が Pascal を知っていたからに違いない）.多くのプログラマ 
は，知らない言語を，よく使っているものに似せようと努力する•初めてその言 
語を学ぶとき，このようなことをしがちである.自分ではとてもはやく C 言語の 
構文に慣れていくのがわかるだろうが，たぶん最初の頃の C プログラムのほとん 
どを Pascal もどきにしてしまうだろう. 

関連した問題に 

//define TRUE 1 

#define FALSE 0 

while( something == TRUE ) 
s t u f f () : 
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用せずにすんだし，読者のプログラムが正しく構造化されていれば，読者も使用 
する必要はない. setjmp / longjmp は，始めからきちんと構造化されていないプ 
ログラムに起こるバグを修理するために，使い過ぎる.これらのサブルーチンを 
使うよりも，プログラムを書き始める前に計画を練るために時間をかける方が 
ずっとよい. 

5.6.2# define の誤使用 

筆者には，“どんな言語でも FORTRAN プログラムを書くことができる”とい 
う友達がいる.不幸にも，彼は本当にそういっている.他の言語と同じように C 
言語を考えようとしてはいけない. 


& 11 
ノ & I S 


がある.ここでの問題は， C は0でない値が真だということである.それで，た 


5.7 if/else 
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とえ something が真でも，条件 something == TRUE は真にならないことが 
ある.式が something ! = FALSE ならば大丈夫だが，プログラムに不必要な 
ことばを加えている （！ something でも同じであるから）.前の例のように，考え 
るよりもはやく適切な C 言語の構文を使えるようになるだろう. 

5. 6. 3 switch 

ブロックの内側に case 文を並べないこと.これで正しいのだが，次のプログ 
ラムのような例はすすめられない. 

switch( x ) 

て 

case a : 

if( some-condition ) 

て 

do_something < ); 

> 

else 

case b :て 

do_something_else(); 

> 

> 

同様に， case は break がなければ次の case に抜けおちるから， switch の中の 

すべての case は， break 文か，故意に break を書いてないことがわかるコメン 

卜で終わりにするべきである. 

switch( x ) 

て 

case a : 

codec ) ; 

/ * このまま case b にすすむ */ 

case b : 

more_code() ; 
break ; 


5.7 if/else 

一般に， if 節の次にわずかな空白も持たないで if / else のブロックがあるよう 

に if / else 文を構成してみなさい. 

1 f( condition ) 

short_block() : 
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long _ block () ; 


ここで，問題は読みやすさである. else の実行を制御する文を else と同じべ 
ージにおこうとしている•さきに短い節をおくと，これがたいてい確実に行われ 

る. 


5. 8 C のスタイル•シート 

このセクションは，本章で討議してきた書式の全問題の概要である.プログラ 
ムの内容は問題にしない.しかし，むしろ C 言語でどのように一般的な構成が 
書かれるべきか，その例を簡潔にまとめたものを示す.読者のプログラムをこ 
のように書くことを強くおすすめする.自分の書式をかえるのならば，変更した 
結果はより読み易さが増すのでかえるとよい.とにかく，しばらくの間それをや 
ってみる必要がある.1度よい書式を使ったら，そのときは絶対的なルールのよ 
うなものに思われる理由がわかるだろう.よい書式は本当に役にたつ. 


よくない： 

f or ( 

i=2+16; i< = MAXCH&&i>0;i+ = 

2 ) f oobar= i ; 


よい： 

f 〇 r ( 

1=2+16; i<=MAXCH && i>0; 
f o o b a r = i ; 

i+ = 2) 


もっとよい： 

f or ( 

> 

i = 2 + 16 ； i <= MAXCH 

foobar = i ; 

&& i > 0; i 

i += 2) 


#include <stdio.h> 

/* FILENAME.C はファイル名 . ここでこのモジュール内のル - チンを記述する . 


extern char * f 〇〇 ( ) ; / * foo が宣言されているモジュールの名刖 * / 

extern unsigned ba r ( ) ; /* bar が宣言されているモジュールの名削 — * / 

extern int G l oba l var ; /* Globalbar が宣言されているモジュールの名前 * / 


* # define と typedef はその名前はすベて大文字である . 

* グローバル変数は最初の一文字だけが大文字である . 

* ローカル 変数はすべて小文字である . 

* 構造体や配列を初期化するときは，縦にそろえて書く . 
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argc , argv 
argc ; 
**argv; 


このコメントは 大ざっぱにプログラム（または サブルーチン） の説明をする . 
各ひき数の働きを説明し，かえ 0 値とその意味を書く . 


\ nt Local-int; /*local 」 nt がすることの説明 */ 

char array [ARRAYSIZE] , *ap; /* array , ap がすることの説明 */ 

static l n t var_2; /* var _2 が i" ることの説明 * / 

wh i l e( s t a tement ) 


while ループで起こることを説明する（みただけではわからな 
ければ） 


body() ; 
mor e_body() ; 


for ( initializer = 0 ; compar i son ( ) ; mod iTy(imtializer 


for_body( arg1,arg2, arg3 ); 
for_body( a r g4 # a r g5, arg6 ); 


> 

if ( a 


#define ARRAYSIZE 


( 1024 * 6) /* 読みやすいので 7224 と書くよりこのほうが 

★よい.コンハ。イラがコンパイル時に式を評価 
* する. 


typedef struct _f 〇〇 

char 
i n t 

struct _foo 

> 

F00 ； 


static int 
static char 


b ； 

*ptr 


Var 
* Va r 2 


:の構造体の用途を説明する 


/ * a の説明 
/* b の説明 
/ * ptr の説明 


/★var がどのように使用されるか説明する */ 
/* var 2 がどのように使用されるか説明する */ 


/* Var 3 と Var 4 の説明をする . 

* 定義の横に余白がないのでコ 


が書けない . 


static F00 
static F00 


Var3 
Var 4 


’a ’， "string", &var4 

'b ' , "another string", (F00 *)NIL 


statement(); 

> 

else if( b >= a && d < b ) 
statements ); 

else 

statement(); 


•1 ta 
anh 
m .1 c r\ 
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return ("a") 
return ("b") 
return ("c") 
return ("d") 
return ("?") 


a.subroutine( a 1 
i nt a 1; 


説明文 


s w i t c h ( a 1 
case CR : 


default 


do_something; 
break ; 


printf( M a_subroutine< ) : bad argument <%c> (0x%04x 〉 \n H , 

a 1 f a 1); 

break ; 


w h i l e (1) 


if 


else 


> 

do 


!do_for ever) 
break ; 

do_something( 


—— a; 

more_stuff(); 


while ( a 1); 


char 
i nt 
i 


*another_routine(b) 

b ； 

swit c h(b) 


5.9 練 習 

5-1 右端もそろった英文テキスト ( right-justifies text * 英文の右端が縦に 
一直線上に並ぶように，1行にできるだけ均等な間隔をあけて単語を配置 
してある）を作成するプログラムを設計しなさい.標準入力から入力し， 
標準出力へ書きだす.入力の最初の行は，出力するテキストのカラム数を 
含んでいる.入力には gets () を，出力には puts () を使うべきである. 


s s s s f 
aaaae 










5.9 練 


習 
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ひとつのサブルーチンが，文の行ぞろえをするために呼びだされ，それは 
適当な文字配列の内容を変更する（別の配列にコピーしないこと）. 

5-2 練習 5-1 で設計したプログラムを書きなさい.すべての stub を示して， 
プログラム開発過程の各段階をすベて書きだしなさい. 














6 ポインタ 


本章は， C 言語において，もっとも誤解が多く，とても重要な部分であるボイ 
ンタを詳しく検討する.10倍もはやくなったというのは聞いたことがないが， 
ポインタは，プログラムの実行時間をかなり改善する（注 1). 実際，配列を使用 
して，ポインタでアクセスしないプログラムは，まったく C プログラムとはみな 
せず， C 言語で書いた FORTRAN プログラムだと思われるほど，ポインタは， 

C 言語の不可欠な部分である. 

不幸なことに，たいていの C 言語の参考書ではポインタはまったく扱われてい 
ないか，いい加減に扱われている•本章では，たいていの C 言語の参考書に書か 
れているポインタについて扱う.そして，読者は他の教科書と並行して本章を読 
んでもかまわない.最初の2, 3セクションは，計算機内で表されるボインタにつ 
いて記述する，メイルボックスのような形態は使わない.これらのセクションで 
は，読者が C 言語での宣言のしかたを知っていて，計算機のアドレッシングも理 
解していると想定している.次章”高度なポインタ”では，ポインタの複雑な使 
用法を詳しく調べる.本章に書いてあることを完全に理解するまでは，次章に移 
るべきではない. 

本章を最初に読むときには混乱するだろうが，詳細をつけ加えるために注釈を 
用いた.最初に読み通すときには，それは無視するとよい.構造体へのポインタ 
は，章の終わりで述べるけれども，たいていの本で適切に扱われているので，深 


注1:ここでは，8085上を走るプログラムについて述べる.構造体の2次元配列へのすべての直接参 
照は，ポインタ参照にかわった•速度の向上は，いつもこれほどめざましくはない.しかし，そ 
れはしばしば，3つか4つの要因のうちのひとつではある.なぜ，そうなるのか，少しみていく. 
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夕 


く説明はしない. 

6.1 簡単なポインタ 

ポインタは， 他の変数のアドレスを保持した変数である.この定義はおぼえて 
おくべきである.ポインタは，他の変数のアドレスを保持した変数である•とき 
には，ポインタのようなアドレス自体を参照することもある.この定義をくわし 
く解析しよう.まず最初に，ポインタは変数である（定数に対して）•それについ 
て特別なことはない.式中に使われるとき，変数名はその変数の内容に評価され 
る.変数（または式）が，何に評価されるかみるよい方法は printf () 文を使う 
ことである.例えば 

printf("%d" , x ) ; 

は X の内容をプリントする.変数 X は，文中で使用されるときはその内容に評価 
される. 

C 言語では，オブジェクトを宣言することで，そのオブジェクトが使うメモリ 
領域を得る（注 2). 宣言 

1 nt x , y ; 

はメモリに2つの整数の大きさのオブジェクト用の場所を割り当てる.つまり， 

コンパイラはこの2つの変数が使うメモリをどこかに確保する•メモリの確保は 
どのコンパイラも行う. x にあるものが何かわからないから 

printf("%d" # x); 

が実行される時点で何がプリントされるか予想する方法はない，メモリ中にある 
x と y の絵を図 6.1 に示す.アドレスは簡単化して示している.これで参照する 
アドレスをわかりやすく表すことができる • int は16ビットであると仮定してい 
る. 

x と y は初期化されていなかったから，ごみを含んでいる.次の式で x と y に 
代入することができる. 


注2 :定義と宣言の違いは，しばしば C に関する本の中に見受けられる.厳密にいえば，定義はメモ 
リを割り当て，一方，宣言はオブジェクトをどのように使うかコンパイラに知らせるだけであ 
る.変数の定義は， いつも 宣言を含んでいる.しかし，オブジェクトにメモリを割り当てない 
でオブジェクトを宣言することができる （ extern 文を用いる）.リンカがプログラムをいつしよ 
にするとき，実際のオブジ ヱ クトを発見する•本章では，宣言ということばを宣言と定義， 
どちらも意味する広いほうの意味に使用する. 
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変数名： 


変数の最初の バイトの 
アドレス： 

1 

1 


| 50 

1 

X : | 

1 

? ? ? 

52 

1 

y : 1 

1 

? ? ? 

54 

1 

1 


| 56 


図6 • 1 

2つの int 変数 


x =100; 
y = x + 1; 


今， x は100を含み， y は101を含んでいる.メモリを図でみると，次のよう 
になっているだろう. 

I | 50 

I-I 

x : | 100 | 52 

I-I 

y ： | 101 | 54 

I-I 

| | 56 


文 x = 100 は 100 を変数 x に入れる（内容を”かえる”ことができる.そう 
いう理由で変数と呼ばれる）.文 y = x +1は変数 x に含まれている数をフェッ 
チして，1をカロえ，それから y に入れる•変数名が式中で使われるとき，その内 
容に評価されるということを意味する • x が文 y = x で使用されるとき， 100 に 
評価される.なぜなら，その数が x に含まれているからである. 

さて，これをすべてボインタに当てはめてみる.次の宣言を考えてみる. 

1 n t *p t r ; 

この文は，ボイ ンタの大き さのオブジェクトにメモリを害り当てる.ポインタ 
は，アドレスを保持する変数であることを思い起こしてみる.したがって，ボイ 
ンタの大きさは，計算機上のアドレスを保持するために必要なバイト数である 
(8080, Z 80， PDP -11 では2バイト， VAX や68000では4バイト，等） • int x 
のように，文 int * ptr は1つのポインタに対してメモリを割り当てる.この位置 
のメモリの内容は，まだ変数が初期化されていないので，定義されていない.他 
の図を書いてみよう： 
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1 

1 


1 

1 

50 

1 

X : I 

1 

100 

1 

1 

_1 

52 

1 

y ： 1 

101 

1 

1 

_1 

54 

Ptr : | 

I 

?? ? 

1 

1 

56 

1 

1 


—1 

1 

58 


ptr は整数をさし示すとコンパイラに教えたけれども，その整数は，ポインタ 
といっしょにつくられるわけではない.もし，配列へのポインタを宣言してもポ 
インタだけがつくられる.配列はつくらない，それで図ではボインタはどこもさ 
していない.概して，ポインタが何をさすかに関係なく，すべてのポインタは同 
じ大きさである（注 3). メモリ割り当てからみると，ポインタ変数が int へのポ 
インタか， long へのポインタか，配列か構造体へのポインタであるかどうかは問 
題でない.しかし，後で理由はあきらかにするが，コンパイラはさし示される才 
ブジヱクトの型を知る必要がある. 

ポインタは変数である.ほとんどの部分で，ポインタは他の変数と同様に使う 
ことができる（注 4) .例えば ， ptr =100は100を ptr という変数に入れる（注 
5) .文 


printf("%d", ptr); 

は100をプリントする（注 6). けれども，ポインタは，他の変数のアドレスを保 
持する変数である.メモリ番地100には既知の変数はない. ptr へ100を代入し 
たことは，間違いではないが，何の意味もない 

変数のアドレスは&演算子でみつけられる .& x は蛮数 x のアドレスを評価す 


注3 :これは いつも 真実であるとは限らない.例えば，8086の ミディアム. モデルでは，関数への16 
ピットのボインタとデータへの32ビットのポインタを，またはその逆で使用できる.多くの C 
プログラムはすべてのポインタを同じ大きさであると想定して いる. しかし，8086ファミリの 
計算機に移植するときは注意することが必要である. 

注4:実際には，ボインタで処理できることには制限がある.次は規則である. 

(1) 代人.ポインタを，他のポインタの値や&演算子で得たアドレスに設定することができ 
る. 

( 2 ) ポインタと整数のたし算とひき算 （2 つのボインタをひとつにすることはできない）. 

( 3 ) 2つのポインタの間のひき算（その結果は2つのボインタの間のオブジェクトの差にな 

る）.ただし，どちらのポインタも同じ型のオブジェクトをさし示していなければならない. 
(4) 他の演算（かけ算，シフト，等）はほとんどできない.どうしてもしなければならないの 
なら，キャストを使ってこの問題を防ぐことができる. 

注5 :多くのコンパイラは ， ptr = ( int * )100; とすることを要求する. 
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p t r = &x ; 

は変数 x のアドレスをボインタにいれる. X はメモリ番地 52 にあるから ， ptr = 
&x は 52 を ptr に入れる.メモリは今，次のようになっている. 


1 

1 


1 

50 

1 

X : | 

1 

100 

1 

1 

52 

1 

y : 1 

1 

101 

1 

1 

I 

54 

Ptr : | 

I 

52 

1 

1 

_ | 

56 

1 

1 


1 

1 

58 


ptr = &x は，他の代入と同様に，ただの代入である.不思議はない. 

ボインタを通して間接的に x を変更するためには， * 演算子が必要とされる. 
C 言語での単項演算子*は， object - pointed-to (被演算数がさし示すオブジェク 
卜を示す）演算子である. *ptr は ptr がさし示すオブジェクトを意味する.さし 
示されるオブジェクトは，ポインタに含まれている アドレス にあるオブジェクト 
である. ptr は 52 を保持している.それは x の アドレス である.従って， ptr に 
さし示されるオブジェクトは，メモリ番地 52 にある変数 x の内容である. 

式* ptr=5 は， 5 を ptr にさし示される x に入れる.すなわち， x=5 と同じこ 
とである.要約すると， ptr (アスタリスクがない）は変数 ptr の内容を評価し， 
*ptr (アスタリスクつき）は ptr にさし示される変数の内容を評価する.その変 
数のアドレスは ptr に含まれている.文 


とプリントする. 


52, 


注6 :ここでは本当に printf () をだましている.スタックにポインタの大きさのオブジェクトをプッ 
シュして ， printf () にはそれが int の大きさのオブジェクトで，まるで数であるようにプリン 
卜させている.これはデバッグの間は役にたつ.しかし，ポインタが int より大きい計算機では 
動かない（なぜならポインタの値が切り捨てられてしまうから）.検討中の ANSI 標準において， 
printf () への引数％ p は，ボインタの大きさのオブジェクトを数のようにプリントすることが 
定められている.しかし，多くのコンパイラはまだこれをサポートしない.ときには ， printf 
() に次のように，ポインタが実際は long であると告げることによって問題を防ぐことができ 
る. 


p rintf (” ％ ld ”， ptr ) 
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次の ptr の宣言 

1 n t * p t r ; 

はポインタの大きさのオブジェクトにメモリを割り当てる.しかし，そのオブ 
ジェクトは初期化されていない.したがって，ポインタがつくられたときは， 
あるオブジェクトのアドレスではなくでたらめな数を含んでいる.そのうえ，コ 
ンパイラは ptr が実際に有効な値を含んでいるかどうかわからない.最初に ptr の 
初期化 （ ptr 二 & x か同じような文）をしないで * ptr = 5としたら，どこかで 
たらめな場所 （ ptr に含まれているアドレス）に5を入れるだろう•もし ptr が0 
を含んでいたら，コマンド* ptr = 5はメモリ番地0に5を入れ，そこにあった 
ものを壊してしまうだろう.初期化していないポインタを使用することはよくあ 
る，危険な エラー である.メモリにあるものを何でも，プログラム自体も含めて 
完全に破壊することができる（注 7). MS - DOS では，ハードディスク上のディ 
レクトリを破壊したり，オペレーティング • システム自体に上書きすることさえ 
できる（注 8). このような災難を避けるためには， ポインタを使用する前に必ず 
初期化するべきである. 

6.2 ポインタと配列名 

配列についてだが， C 言語には一般の配列のようなものはない.著者がいいた 
いことは以上である.あるのは，すべて同じ型を持つひと固まりのオブジェクト 
に対して，メモリを害 ij り当てる方法である.そして，このオブジェクトの固まり 
を”配列”と呼ぶことができる.しかし，この”配列”は， C 言語の型にはない. 
配列の要素は，ひとつのオブジェクトのように操作することができる.しかし， 
配列全体をひとつとして操作することはできない.つまり，実際に配列が型とし 


注7 :多くの大きなメインフレームは，ポインタをデータに上書きさせる.しかし，それらはプログ 
ラムとは分けている.例えば， UNIX では制御できないポインタが命令コード上に書き込もう 
としたら，” segmentation violation : core dumped ” のエラー.メ ッセージを出すだろう.一方， 
多くのマイクロコンピュータは，このようなチェックは何もしない.” core ” はプログラムが終 
了したとき格納されるコンピュータのメモリ•イメージを含んだファイルである.それは大き 
なファイルであまり役には立たない . rm core コマンドで消去することができる. 

注8 :ディスクのディレクトリ構造の-部である FAT がメモリに格納され，ファイルが閉じるときに 
ディスクに書きだされる.ラージ.モデルのプログラムのポインタか，またはスモール•モデ 
ルの far ポインタは FAT に上書きして，ログイン時のディスクのディレクトリを壊すことがで 
きる. 
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て存在するならば，ひとつずつ要素をコピーしなくても，等号で配列全体を別の 
配列に代入することができる.配列を値でサブルーチンに渡すこともできる.配 
列のサイズより大きな添字で配列の要素をさし示すことはできない.等々（注 9). 
配列の概念（オブジヱクトの固まり，要素がメモリ内で連続していてすベて同じ 
型である）は存在する.しかし，配列は配列として操作できない.ポインタを使 
つて，ひとつずつオブジェクトを操作しなければならない（しばらくの間 この ポ 
インタの使用について述べる（注10)). 


は5つの整数にメモリを割り当てる（まだ初期化されていないので，このときは 
ごみを含んでいる）.それらは必ずメモリ内で連続している.しかし，それらをひ 
とつの配列としてではなく，5つの別個のオブジェクトだとみなすべきである. 
割り当て後のメモリを図 6.2 に示す. 

5つの整数を割り当てているけれども，これらの整数は同じ名前ではない•ど 
のようにそれらをアクセスすることができるだろうか？ C 言語では，配列名は 
いつも配列の最初の要素へのポインタとして評価される.つまり，配列名は，配 


| | 50 

I-I 

x : | 5 | 52 

I-I 

y : | 101 | 54 

I-I 

ptr : | 52 | 56 

I-I 

array : | | 58 


60 

62 

64 

66 


図 6.2 メモリに配列を加える 


注9:ポインタにかっこを使うことはどうしてもできない. 

注10 :そのポインタは，配列名から派生した暗黙のポインタであるかもしれない.いずれにしてもポ 
インタである. 
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列の最初のオブジェクトをさし示すように，初期化されたボインタ変数であるか 
のように使用される.しかし，配列名は定数である.ポインタのように操作され 
ることはできない（注 11). しばらくの間これについて述べる • 

配列の宣言と配列名を使用する方法を混同するべきではない.配列名がポイン 
夕のように使用されているけれども，配列とボインタはまったく違う.配列は， 
型の集合体 (aggregate type ) — すべて同じ型を持つ連続した変数の集合—であ 
る.ポインタは単独で，ポインタの大きさの変数である.宣言 int array [5] は， 
5つの整数にメモリを割り当てる.それには10バイト必要とする.宣言 int *ptr 
はひとつのボインタにメモリを割り当て，メモリに2バイトを必要とする.しか 
し，ポインタがアクセスするオブジェクトにはメモリを割り当てない. 


本当は 

char buf[128] ; 

gets(buf) ; 

/* 正しし 

としたいのに 

char *p ; 

g e t s ( p ); 

/* 誤り 


とするのはよく犯すエラーである（注 12). サブルーチン gets () は，引数と 
して，標準入力から得る文字を入れるメモリ•ブロックのアドレスを期待してい 
る.配列名は，配列の最初の要素のアドレスに評価されるから，呼び出し gets 
( buf ) は期待通りに動作する. buf は，128バイトのブロックの最初のバイトの 
アドレスに評価される.一方， p はひとつのボインタ•サイズの変数である•ア 
スタリスクなしでは， p は変数 p の内容に評価される.呼出し gets ( p ) は ， gets 
() に変数 p の内容を渡す.それは文字を入れるメモリ•ブロックのアドレスだ 
と思われている.しかし， p はごみを含んでいる.何かをさし示すように p は初 
期化されていない . p にはメモリを割り当てられたとき，たまたま，そこにあっ 
たでたらめな数が含まれている.したがって， gets () はメモリのでたらめな位 
置に文字を入れ始める.もし本当に gets () に p を使いたいなら，次のようにす 
るべきである. 

注11:アセンブリ言語では配列名は，配列の最初のセルに関係するラベルである.一方，ボインタは， 
メモリの他の場所のアドレスを含むメモリ中のセルである.つまり，配列名はラベルであり， 
ポインタ変数はラベルではない. 

注12 :筆者はいままでに， c 言語を教えることを目的とする産業レベルの教科書でこのエラ—をみた- 
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char buf [ 128]; 

char * d ; 

p = buf ; 
gets ( p ); 

しかし ， gets ( buf ) で十分なのに，わざわざ buf の最初の要素のアドレスをコピ 
一する必要があるだろうか. 

ここで問題になるのは，多くのコンパイラの マニュアルに 書かれて いる g e t s () 

の使用方法である.次のように gets () の呼出し文が書かれている. 

gets ( str ) 
char * str ; 

表現は，このサブルーチンが引数として，文字へのポインタを必要とすること 
を意味する. Pascal のような型に厳しい言語に慣れている プログラマは， gets 
() に文字へのポインタとして宣言された変数を渡さなければならないと思いが 
ちである.しかしこの考えは誤りである. マニュアルに， gets () が char への 
ボインタを期待していると書いてあるときは，型が char である変数のアドレスを 
期待しているということである（ポインタがアドレスを保持している変数であり， 
かつ，ボインタの変数名はその内容を評価することを思い出す とよい ）. いくつか 
の方法でアドレスを得ることができる.もっとも簡単な方法は，配列の名前（か 
っこはいらない）を使うことである. char の配列をさし示すように初期化された 
ポインタの内容を gets () に渡すこともできる. 

gets () は，その引数でさし示された文字に，いくつか char の大きさのオブ 
ジェクトが続く •つまり， gets () に渡されたボインタは，配列へのボインタ 
であると想定している.しかし，配列名はその配列の最初の要素のアドレスに評 
価される•重要なことは， gets () にはアドレスだけが渡され，そのアドレスが 
配列のアドレスであるか，ひとつの char のアドレスなのか決定する方法がないと 
いうことである•いいかえれば，配列へのポインタは同時にその配列の大きさの 
情報を持たない.サブルーチンは配列の大きさがわからないから，その配列は十 
分に大きいと仮定しているだけである.この処理はプログラマの責任である. 

配列名に話をもどす.配列名は，配列の最初のセルをさし示すよう初期化され 
たポインタのように使うことができる • つまり， 配列名は，その最初の要素をさ 
し示すために初期化されたポインタと同様に，最初の要素のアドレスに評価され 
る.例を使うと，文 
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get s ( s t r ) /* サブルーチン gets の 定義：引数 Str は gets ( ) が文字を入れ */ 

char *str; /* る配列の最初の要素のアドレスである . 

^ ' 
> 


m a 1 n () 

て 

char ar ray [ 10 ]； 
char c, *cp ; 

gets( array ) ; / * 正しい.” array” の最初の要素のアドレスを渡 * / 

/* す. */ 

g ets( cp ); /* cp が初期化されているときだけ正しい•文字 配 */ 

/* 列のアドレスを保持しているに違いない， cp の */ 

/* 内容を渡す. */ 

aets( &c ); /★ 間違い.構文は正しくて，エラー•メッセージ */ 

/* はプリントされない.文字のブロックの最初の */ 

/* アドレスよりもひとつの文字のアドレスを gets * / 

/* () に渡す. */ 


図 6. 3 ボイ ンタ 引数を 持つサブルーチンの 呼出し 


p ri n t f ("%d" , array) ; 

は 58 をプリントする （ array の最初の要素のアドレス； printf( ) に％ s でなく 
% d を与えたことに注意せよ）.配列名は，いつもボインタであるかのように扱わ 
れる.宣言 int array [5] であれば，式* array 二 20 は C 旨語では完全に正しい. 
コンパイラは，配列名をその配列の最初のセル（アドレス 58 にある）をさし示 
すように初期化されたボインタのように使用する.つまり， 58 を含んでいるボイ 
ンタとして array を使う.式* array = 20 は 20 をメモリ番地 58 に人れる. 

ポインタ変数 ptr を使用する前に初期化していれば， ptr を配列への書き込み 
に使うこともできる. ptr は次の 2 つの方法のいずれかで初期化することができ 
る. 


Dtr = &ar ray [0] ; 
ptr = array; 

最初の文は簡単にわかる.&はアドレスを示す演算子である.式 & array [0] 
は，’ array [0] のアドレス，’，または array の最初の要素のアドレス，すなわち 58 
に変換される.配列名は，配列の最初の要素のアドレスに評価されるから， 2 番 
目の形式の代入文を使うこともできる.この 2 番目の初期化も， array の最初の 
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要素のアドレスを ptr に入れる • ptr は今58を含んでいる.すなわち， array の最 
初の要素をさし示している.その関係は次のように書くことができる. 


ptr: 

I - 

| 58 * 


array: 

I-I 

> | 20 I 


58 

60 

62 

64 

66 


矢印は， ポインタとそれがさし 示す オブジェクトとの 関係 を 示す. ptr を 初期 
化してあれば，それを使うことができる.式* ptr =100;はポインタ ptr に含 
まれているアドレスにあるオブジェクトに100を代入する. ptr は58を含んでい 
るから，100がメモリ 番地 58に 移動す る.その 番地は array の最初のセルである. 
メモリは今次のようになっている. 


ptr: array: 

I- I I- I 

I 58 * - | - > | 100 | 58 

I - I I - | 

| | 60 

I - I 

| | 62 


64 

66 


通常のボインタ構文を使用して，さし示されているオブジェクトを更新するこ 
とができる.例えば ， *ptr = *ptr +1[または （* ptr ) + +] で ptr にさし 


示されているオブジェクトに1を加える（100から101にかえる）ことができる. 


6.3 ポインタの計算 

ポインタと，ポインタとして使用される配列名には大きな違いがある.ポイン 
夕は変数である.変数の場合は，変数の内容を変更することができる.一方，配 
列名はポインタのように使われるけれども，変数ではない.定数である. ptr + + 
とすることができる.しかし， array + +とはできない（注 13). 

文 ptr = ptr +1(または ptr - h - h ) はポインタ自体に1を加える （x + + が x 
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に1を加えるように）.さし示されているオブジェクトは更新されない.ポインタ 
だけが更新される.しかしポインタに対しては，1がひとつのオブジェクトを意 
味するということを間違えやすい.つまり，実際にはボインタの内容に1を加え 
てはいない.さし示されているオブジェクトの大きさが，ポインタに加えられて 
いる. ptr は int へのポインタだから（宣言 int * ptr で定義されている）（注14)， 
ptr には2が加えられる （ int の大きさは2バイトだから）.文 ptr ++ は ptr の内 
容を58から60にかえる.そして ptr は， array の2番目の要素をさし示す•今 
*ptr =10とすれば，アドレス60のセルに10を入れる.メモリは次のように 
なっている. 


ptr: array: 

I- I I- I 

| 60 * - 1 -+ | 667 | 

I - 1 I I - I 

+- > I 10 I 


58 

60 

62 

64 

66 


ポインタの計算は，すべての整数が式中で使われる前に，さし示されている 
オブジェクトの大きさをかけられているところが，通常の計算とは異なる（注 

15) .式 


ptr += 3; 


注13 :前の注釈で配列名がラベルであることを述べた.それを調べる別の方法がある.最初の要素 
のアドレスは，シンボル•テーブルに格納されているから配列名は定数である.つまり，最初 
の要素のアドレスを保持している変数はない.むしろ，コンパイラは，シンボル•テーブルに 
あるアドレスをおぼえていて，配列名が使用されるごとに即値命令（または， auto 配列のフレ 
—ム•ポインタへの参照）を生成する.シンボル.テーブルは実行時には存在しないから，シ 
ンボル.テーブルの一部であるアドレスを変更することはできない. 

注14 :ポインタを増加するとき，いくつボインタに加えるかコンパイラに知らせるのがボインタの宣 
言である.このことに気づくことは重要である.ポインタを増加させるとき，ポインタが実際 
に何をさし示しているかに関係なく，ポインタに sizeof ( int ) を加えるだろう. int へのポイン 
夕として宣言された変数が，本当に int をさし示しているのかどうかコンパイラは関知しな 
い . printf (9 章でよく調べる）は，宣言されたオブジェクトの型以外のものをさしている，ポ 
インタのよい例がある. 

注15:実際には，どのような整数型でも行う.式か，または long int を使うことができる•ただし， 
すべてのコンパイラが long int を受け付けるとは限らない.例えば ， p + ( x *4) は ， p がボイ 
ンタで， （ x *4) が int に評価されるならば，正しい. 
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は ptr の内容に [3 * sizeof ( int )] を加える （ ptr にアドレス66をさし示させ 
る）.式 

ptr - = 3; 

は ptr をもとさしていたところをさすようにもどす.これらの式は，どちらもポ 
インタを計算する.それで， ptr を減少させて，同時にさし示しているオブジェ 
クトを更新するために 

*( ptr -= 3 ) = ' x ' ; 

とすることもできる. 

2つのポインタのひき算をすることもできる.ひき算の結果は，2つのポイン 
夕間の差をオブジェクトの数（バイト数ではない）で表す.例えば，4番目の要 
素 （array [3])をさすポインタから，最初の要素 (array [0])をさすポインタを 
ひくと整数3になる.ひき算の結果はポインタではなく整数になる. 2つのボイ 
ンタは，同じ型のオブジェクトをさしていなければならない.ポインタはほかの 
すべての算術演算ができない. 

ポインタ計算とさし示されているオブジェクトへのアクセスは，ひとつの式に 
組み合わせることができる.例えば，*と+ +か一一をひとつの式に組み入れる 
ことができる.これを行うときは，演算子の優先順位に気をつけなければいけな 
い•いくつか例をみてみよう. 

x = * p t r + + ; 

は一度に2つのことを行う.増加させられるものがあり，同時に， x に入れられ 
るものがある.増加させられるものは何か？ ボインタ自体か？ それともさし 
示されているオブジェクトか？この問題は，式を十分にかっこで囲めばわかる. 
Appendix A の優先順位の図をみると，*と+ +演算子は同じ優先順位であるこ 
とがわかる.しかし，右から左に関係づけられるから，式には次のようにかっこ 
がつけられる. 

x = *( ptr + + ) ; 

* は式 ptr + +全体に及ぶ（いい換えれば，+ +の方が*より強く名前に結びつ 
けられている）.ポインタ自体が増加される•次に，変数名に+ +が続くからこ 
れは後置きのインクリメントであることに注意する必要がある.ポインタを使用 
した後で，それを増加する.次の質問は”式は何に評価されるか”ということで 
ある.アスタリスクの番である.式は， ptr にさし示されているオブジェクトの 
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内容（増加する前の）に評価される.それで， ptr にさし示されているオブジェ 
クトを x にコピーする.それから， ptr を増加させる. 

さて，次の式を考えてみよう. 

x = *++ ptr ; 

この式は，+ +が変数名の前にあるから， ptr がさし示すオブジェクトがフェ 
ッチされる前に ptr が増加する以外は，先例と同様に動く.みえないかっこは 

x = *( + + p t r ) ; 


はどうだろうか.++と*の位置が交替している.この動作はさきほどとはかな 
り違う.式のかっこは 

x = + +( *ptr ) ; 

である.++はさし示されているオブジェクトに影響する.さし示されている才 
ブジェクトが増加され，さし示されたオブジヱクトの増加した値が X にコピーさ 
れる.ボインタ自体はかわらない.後置きインクリメントを使った等価な式は 

x = ( *ptr ) ++ ; 

である.これにはかっこが必要である. 

今まで述べたすべての式は，さし示されているオブジェクトに評価される.い 
いかえれば，コンパイラにさし示されているオブジヱクトをフェッチして，それ 
を X に入れるよう教えている . X =が必要である.コンハ。イラにオブジェクトを 
フェッチして，それをどこにも入れないように教えることはできない.文 

*P; 

だけが行にあっても，文 


だけがあるのと同様意味がない.このような省略は "lvalue required ” エラー. 
メッセージを生成する （10 章で詳述する）. 

6. 4角かっこ （[]) 表記 (Square Bracket Notation ) 

ポインタ計算のために，実際にポインタを変更する必要はない•例えば ， ptr 
が配列をさしているとする.次の式でさし示されているセルから，オフセット3 
のところにあるセルを変更することができる. 
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*(ptr + 3) = 5; 

この式はコンパイラには，” ptr の内容に3 * sizeof ( int ) を加えたアドレスに 
あるメモリ•セルに5を代入する”と解釈できる（注 16). いいかえれば，さし 
示されているオブジェクトは次のアドレスにある. 

ptr の内容+ (3 * sizeof (オブジェクト〉） • 

ptr 自体は変更されない. 


ptr: 

I- 

| 58 * 


*(ptr + 2) = 6; 


array: 

指標： 

アドレス： 

オブジェク 
のオフセッ 

0 

卜- 

-> | 

1 禱麵 ■■細 

—1 

| array [ 0 ] 

58 

1 

1 

1 

I array [1] 

60 

1 

| - 一 
1 6 

• 1 

I array [2] 

— 1 

62 

2 

| _ ■ 
1 

1 

I array [3] 

1 

64 

3 

| - 一 
1 

| array[4] 

68 

A 


図6 • 4 配列へのポインタ 


卜内 

L * 


図 6.4 に示された状況で，具体的な例をみてみよう.次の式で array の3番目 
の要素を変更できる. 

*(ptr + 2) = 6; 

(3 番目の要素は，その配列のベースからオフセット2のところにある.） 

コンパイ ラは， ptr の内容（数 58) を取りだして，4 (2 * sizeof ( int )) を加 
える.その結果は62になる.それから，6をさし示されているオブジェクト （62 
にあるオブジェクト）に移動する. ptr 自体は変更されない（たし算はその場か 
ぎりの変数で行われる）. 

配列名は実際，配列の最初の要素をさし示すために初期化されたボインタのよ 


注16 :つまり，さし示されているオブジェクトの大きさの3倍である. 


ができないように 
または 


x + 1= y; 
ptr + 1= y ; 


とはできない 


*ptr + 1= y ; 
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うに使用することができる.今は， ptr も配列の最初の要素をさし示しているか 
ら，次の式で同じ動作を行うことができる. 

♦(array + 2 ) = 6; 

名前 array は前の例で ptr が扱われたのと同じに扱われる. 

これがすべて，なんとか慣れ始める.実際に，等式 

★(array + 2 ) == arrayL ど ] 

はすべての配列に対して維持される. [] 表記は単にポインタ演算の簡略表現で 
ある.この等式を一般化したものを次式に示す. 

★(array + i) == a r r a y [ i ] 

配列は存在しないと前述した•コ ンパ イラはボイ ンタ についてだけ知っている. 
配列名は， [] が続いても続かなくても，いつも配列の最初の要素に評価される. 
[] 表記は，コンパイラに次のことを指令する. 

( 1 ) [] の中にある数に，配列要素の大きさ（さし示されているオブジェクト 
の大きさ）をかける. 

(2) 配列名で示されているポインタの内容に，オフセットとして （ 1 ) の結果 
を加える（配列名は，配列の最初の要素へのポインタに評価されるから）. 

( 3 ) 計算されたアドレスにあるオブジェクトを取りだす. 

C 言語で演算子を操作するその方法は規則正しいから， [] 表記がポインタに 
も適用されることがわかる.つまり，次の式は ptr がどんなポインタのときにも 
維持される. 

*(pt r + i) == p t r [ i ] 

配列名はボインタに評価されるから，この式は配列を操作するときに現れる. 
この等式の i == 0の場合は興味深い. 

*(p t r + 0 〉 == *ptr == d t r[ 0 ] 

あるいは，これを言葉に置き換えると，ポインタ名の右に [0] があるときは 
いつも， [0] はポインタ名の左にある*と置き換えることができる（注 17). 

[] の左にある名前は，配列名である必要はない.ポインタ名でもよい.配列 
名はボインタであるから，式 


注17:厳密にいえば，多次元配列（次章で述べる）に関しては当てはまらない.実際は次のようにな 
る. 


( ptr [ x ][ y ]...[ z ])[0] == *( ptr [ x ] [ y ]...[ z ]) 
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1 nt array [5], w ptr ; 
ptr = array; 

が与えられていれば，次のすべての式は同じことをする. 

★(array + 3) = 5; 

*(p t r +3) = 5; 
a r r ay[ 3 ] = 5; 

p t r [ 3] =5; 

ptr は変数であるから，次のようにも書ける. 

ptr = array; 
ptr += 3; 

*p t r = 5 ; 

ここで ptr 自体は変更される.しかし， array は定数であり，変数ではないか 
ら ， array + = 3 ;とはできない- 

これらすべての文が同 じであれば，どうして [] 表記の代わりにボインタを 
使用するのか？ 答えは効率を考えることにある . x = p[i + +] が実行されて 
いるとき，コンパイラに実際に命令していることを考える必要がある. 

( 1 ) i の内容を取りだす. 

(2) さし示されているオブジヱクトの大きさを，この内容にかける.その結果 
をそのときかぎりの変数に格納する. 

(3) それから， i を増加してもとにもどす. 

(4) p の内容を取りだす. 

(5) (2) のかけ算の結果を （4) の結果に加える. 

(6) 最後に，今計算されたアドレスにあるセルの内容を取りだして x に入れる. 
これには3つのフェッチ（取りだすこと）とひとつのかけ算がある.ここで， 

式 x = * p + + を考えよう.この式は同じ動作を行う（注 18). この2番目の式 
は，次のことを行う命令コードをコンパイラに生成させる. 

( 1 ) p の内容を取りだす. 

( 2 ) そのアドレスにあるオブジェクトを取りだして x に入れる. 

( 3 ) p にさし示しているオブジェクトの大きさを加える. 

( 4 ) たし算の結果を p に格納する. 

ここには，フェッチが2つだけでかけ算はない（注 19). そのかけ算が，非効 

注18:これは， p が正しい配列要素をさし示すように初期化されているかぎリ真実である.もちろん， 
初期化自体は，一度は行わなければならないというだけで，さきに述べた処理と同様に効率的 
ではない. 

注19 :より正確にいうと，かけ算もやはりある.しかし，実行時ではなくコンパイル時に行われる. 
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率になる主な原因である. 2章でみたように，かけ算は費用のかかる動作である. 
よってそれを使わなくてもよいようにするべきである.これは，ハードウェアで 
かけ算をサポートしていない8085のような計算機を使うときには特に重要な問 
題となる.また，たいていの計算機のハードウェアのかけ算は，ハードウエアの 
たし算の何倍も時間がかかる.もうひとつの非効率の要因は，オブジヱクトの実 
際の大きさである. 2のかけ算はただのシフトでよいが，6のかけ算（構造体や 
配列へのポインタで使う）は違う•一方で，多くの計算機は，2のべき乗のかけ 
算さえ，シフトを使わずにかけ算のサブルーチンを呼びだす. 

オーバ- 、、', ドの点から， p [ i ] と* (p + i ) に差はないことに気がつくべき 

である.どちらの場合も実行時にかけ算がある.しかし， i が定数一 p [ l ] か* (p 
+1)—であれば，そのときは実行時ではなく， コンパイラがコンパイル 時にか 
け算をすることができる.定数を使用する配列のアクセスは，変数を使用する配 
列のアクセスよりも速い.かっこと定数を使うアクセスは合理的な動作である. 
配列が static で宣言されていれば，必要なセルの実際のアドレスは コンパイル 時 
に決定されてしまう. 

同様に，配列をランダムにアクセスする必要があるならば，かっこを使用する 
べきである.その方が読みやすい.しかし，配列をでたらめにアクセスする必要 
はほとんどない. たいていは， 規則正しいやり方で配列を操作する.列単位か， 
行単位か対角線に，などのやり方で.その場合は，ポインタが はやい と思われる. 

6.5 文字配列；初期化 

たいていの変数はそれらを宣言するとき，宣言に続く等号と初期値で初期化す 
ることができる.例えば 

i n t x = 5 ; 

は変数 x にメモリを割り当て，同時に x を5に初期化する.固定したアドレスに 
ある配列（グローバルか予約語 static を明示してあるもの）も同様に初期化でき 
る. 

static 1 nt array[5] = -C 5, 4, 3, 2,1 >; 

ここで ， array [0] は 5 に ， array [1] は 4 に，などのように初期化される.実 
際は，配列を初期化するときは特に配列の大きさを規定する必要はない.例えば 

static int a r r ay[]= 


{ 4, 5, 6 >; 
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は3つの要素を持つ int の配列をつくる.最初の要素は4に，2番目は5に，3番 
目は6に初期化される.次の式で，配列にある要素の数を決定することができる. 

sizeof(array) / sizeof(array[0]) 

これは，バイト数で表した配列全体の大きさをバイト数で表したひとつの要素の 
大きさで割っている（注 20). 

C 言語では，暗黙の，宣言された配列：リテラル文字列がある • 2重引用符 
(”） で囲まれた ASCII 文字列は，そのような文字列を形成する.それらの文字 
は，メモリの連続したバイトに入れられ ， ASCII NULL (へ0’ 数 0) が最後に 
つけ加えられる.式全体は，最初の文字が入れられているメモリへのポインタに 
評価される.例えば次の文 

printf("Hello"); 

が あるとする. コンパイラは， 5つの文字 （， H ，，， e ’， T ， T ， ，〇，） を プログラマ 
にはみえない5つの連続したメモリ番地（そのアドレスをみつける簡単な方法は 
ない）に入れる.それから0 ( 数値 0 x 30 を持つ ASCII 文字の’0’ ではない）を 
6番目の番地に入れて，最初の文字のアドレスを printf () に渡す（図 6.5 をみ 
よ）（注 21). 


preintf ( ’ Hello ”）; 

は次の暗黙の配列を生成させる： 

50 


52 

53 

54 

55 

そして数50を printf () に渡す. 
図6 • 5リテラル文字列 



注20 :これはしばしばマクロにされる. 

# define array _ size ( x ) ksizeof ( x )/ sizeof 、 ギ x )) 

注 21 :文字列””は，，\〇’ を含む char の大きさのメモリ.セルへのボインタとに評価される. 
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2重引用符は，文字へのポインタに評価されるから，文字へのポインタを初期 
化するときに，それを使うことができる.例えば 

char * m s g = "H elL o "; 

は 2 つのことをする•最初は，文字列” Hello ” に6バイトを割り当てて，それ 
らを初期化する.それから msg というポインタの大きさのオブジェクトにメモリ 
の割り当てをして，’ H ’ をさし示すように msg を初期化する.この状態を図 6* 
6に示す. 


msg : 

60 
61 
62 

63 

64 

65 

図6 . 6暗黙の文字列 



ここで注意することが2, 3ある.まず，この配列は通常の意味の配列ではない. 
つまり，この配列には名前がない.そのため，直接アクセスすることはできない. 
それに達するにはボインタを使う.次に， msg は変数であるが配列ではない.配 
列をさし示すように初期化されている.しかし， msg はひとつで，ポインタの大 
きさのオブジェクトである. msg はボインタであるから，配列への他のボインタ 
と同様に，配列をアクセスすることができる•例えば 

X = msg[2] ; 

は ASCII T (108) を x に代入する.同様に， * msg は文字’ H ’ に評価される. 
msg は変数だから，変更することができる•つまり ， msg + + とすることもでき 
る.この変更は msg が配列名だったら許されない.もちろん， msg がどこか他 
をさすように変更すれば，文字列は配列のように格納されているけれども名前を 
持たないから，再びその文字列をさし示す方法はない（注 22). 

問題が混乱するけれども，次のように文字配列を初期化することもまたできる. 
char a [ 1 28] = "f 〇〇 " ; • 
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この宣言は128バイトの配列をつくるが，ポインタは生成しない.この配列の 
最初の4つの要素は文字’ f ’， ’〇’，，〇’，と’\0’ に初期化されている.次のように 
することもできる. 


char a [ 1 28] = < ' f' , 'o', 'o', ' \0'> ； 

これはかん違いは少ない が 不便である. コンパイラの 中には，暗黙の文字列に 
128文字の制限をおくものもあるので，この2番目の形の初期化をとても長い文 
字列で使用しなければならないかもしれない（注 23). 

printf () のサポート•ルーチンの中に，引用符で囲まれた文字列を使う面白 
い応用がある.次の文を考えてみる. 

putchar( "0123456789abcdef"[ x & Oxf ]); 

引用符で囲まれたすべての文字列は，その文字列の最初の文字へのポインタに 
評価される•また， [] 表記はどんなポインタにも，たとえ暗黙のポインタで 
も，適用できる.したがって， x が0から15の範囲の数 （& Oxf がそれを保証 
している）であれば， x はその文字列が配列であるかのように文字列をさし，そ 
してひとつの文字を取りだす. x の値が0であるならば， ASCII 文字の’0，がプ 
リントされる. x の値が10 ( Oxa ) であれば，その時 ASCII 文字の’ a ， がプリン 
卜される，等々.いいかえれば， x は配列のベース•アドレスからのオフセット 
を計算するのに使用され，そのオフセットにある文字が putchar () に送られる. 
配列のベース•アドレスは，2重の引用符表記の中に暗示されている.このやや 
奇妙にみえる式は，16進数から ASCII への変換を行う.この式の簡潔さは魅力 

注22 :次のようなものでリテラル文字列を変更することが可能である. 

msg [2] = ’ C ’ ； 

しかし，リテラル文字列定数の内容を変更することは悪いプログラミング.スタイルだと考え 
られる.他の点では，同じ内容の2つのリテラル文字列が，メモリの別の場所に格納されてい 
る.例えば 

char * msgl = Hello ; 
char * msg 2 = " Hello "; 

は 2 つのボインタの大きさのオブジェクト （ msgl ， msg 2) をつくる.同時に，文字列 ” Hello ” 
に初期化されている6バイトの文字配列も2つつくる.しかし，すべてのリテラル文字列がユ 
二ークであることを保証しないコンパイラが2, 3あることに注意すること. 

注23:次の文で4バイトの文字配列を宣言することもできる. 

char a [ ] = ” foo ” ； 

しかし，これは思い違いをしやすい.この方法の利点のひとつは （char *p = ” foo ” と比較 
して）， a が定数であり，シンボル•テーブルに格納されるということである.つまり，配列の 
最初の要素のアドレスを保持するために作られるボインタの大きさのオブジェクトがない. 
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的だが，プログラムは理解しにくいため，あまり維持しやすくはない.読みやす 
くするためには次のようにするのがよい. 

char a[ ] = < 'O',' 1 ' , ' 2 ' , ， 3', ' 4 ' , ' 5 ' , ' 6 ' , ' 7 ' f 

' 8 ' , ' 9 ' , 'a' , 'b' # 'c', 'd', 'e' f 'f 1 >; 

putchar( a[ x & Oxf ] ); 

変数のはっきりした初期化の効果は，記憶クラスによって異なる. auto 変数（サ 
ブルーチンに口ーカルで， static と明示して宣言されていない変数）はサブルー 
チンに入るごとに初期化される.さらに，集合している型（配列や構造体）はは 
っきりと初期化されていないかもしれない.固定アドレスにある変数（すべての 
グロー バル変数と予約語 static で宣言されたロー カル変数）は異なる扱われ方を 
する.固定アドレスにある集合体は，たとえそれらがサブルーチンに口ーカルで 
あっても，初期化することができる.口ーカルの static 変数は，連続したサブル 
—チン呼出しの間もその値を保っている.最初にサブルーチンが呼ばれるとき， 
静的な口ーカル変数は明示して初期化された値を持っている.同じサブルーチン 
が2度目に呼びだされたとき，その変数は，サブルーチンが最初にリターンした 
ときの値を保っている. 

固定アドレスにある変数を初期化するための命令コードは生成されない.初期 
値はディスクから読み込まれる•つまり，プログラムの命令コードと，初期化さ 
れたデータは共にディスタに格納されている.固定したアドレスの場所を確保す 
るために，値をディスク上におかなければならないから，明示して初期化されて 
いないようなすべての変数はコ ンパイラが 0に（ごみよりも）初期化する.これ 
はコ ンパイル 時間に2, 3ミリセコンド（1000分の1秒）余計にかかる.しかし， 
これは特に大きな配列では実際都合がよい.命令コードは auto 変数を初期化す 
るときには生成される. 

6. 6練 習 

次の線習問題では，配列の宣言以外には表記 p [ i ] は使ってはいけない.表記 
*(p + i ) はどこにも使用してはいけない（指標ではなく，ポインタを増加させ 
るようにする）. 

6-1 練習 5-2 の回答に，明示して配列の指標を使っているならば，ポインタを 
使ったプログラムに書き直しなさい. 
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6-2 文字列を逆順にするサブルーチンを書きなさい（ひとつの文字列を他にコ 
ピーしないこと）. 

6-3 サブルーチン 

subs t( str, pattern, replacement ) 
char *str, *pa t tern, *replacement; 

を書きなさい.このサブルーチンは str を通して， pattern を探し， replace - 

ment で pattern をすベて置き換えなさい.例えば，呼出し 

char array[ 128 ] = "this foo is a foofooo string"; 
subs t ( array, "foo", ••<->•■); 

は 

"this <-> is a <-><->o string" 

に変更された酉己列をもってリターンする. 










7 高度なポインタ 


7.1 複雑な宣言 

C 言語の利点のひとつは，その規則正しさである.同じ構文がポインタの宣言 
にも，使用にも用いられ，同じ優先順位と結合法則のルールが，どちらの場合に 
も適用される.演算子+ +と * の組合わせがどんなに重要であるかをみてきた. 
そして，同じことが複雑なポインタの宣言にも当てはまる.もっとも簡単な宣言 
をいままでは述べてきた. 

1 nt * i P ； /* int へのポインタ*/ 

int l a [ 3 ] ; /★ int 配列 */ 

後者は，名前 ia が配列の最初の要素をさし示すように初期化したポインタのご 
とく使用することができる（それが定数であることは除く.定数だから修正はで 
きない）.上の2つの表記を組み合わせると何になるか？ 

int * a p 1 [ 3 ] ; 

が宣言しているものは何か？ 配列か，それともポインタの配列か？ この質問 

に答える鍵は優先順位図 （Appendix A ) にある.どちらの演算子の優先順位が 
高いのか， * か！；]か？ 優先順位図によると， [] は*の上の行にあること 
がわかる.だから， [] のほうが高い優先順位を持つ.つまり， * よりも名前 
api との結びつきが強い.この事実から，宣言にかっこ付けをすることができる. 
int ( *( api[3])); 

api が何であるかみつけるためには，もっとも内側のかっこ内から始めて，外側 
にすすむ.もっとも内側の式は，それだけが行にあれば，配列の宣言をしている 
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ことになる.したがって api は配列であり，3つの要素を持つ.何の配列か？ ひ 
とつ外側のかっこの レベルに すすむと， * がある. * だけが行にあったら，ポイ 
ンタを宣言しているのだろう.それで， api はポインタの配列である.では，何 
へのポインタか？ もっと外側にすすんで，予約語 int をみつける.これをまと 
めると 


int * a p 1 [ 3 ] ; 


は， int int 

へのポインタ * 

を3個の要素として持つ，配列 [3] 

である. 

int へのボインタの配列は宣言したが， int 自体は宣言していない.適当に初期化 
された配列が図 7.1 に示されている（注 1). 図 7.1 には（本章のほとんどの図に 
は），すべての セルの アドレスが数に コロンを つけて示してある.これらのアドレ 
スは簡略形である.しかし，図で表しているものを示すには役にたつ. 

図 7*1 では， api の3つの要素が整数変数 x ， y ， z をさし示すように初期化され 
ている.これらの変数は，明示して宣言しなければいけない . x と y は， api が宣 
言したときと同じ優先順位を使ってアクセスされる. [] は*より高い優先順位 
である （* より結合が 強い） から，次の文で x を初期化することができる. 
*api[0] =1; /* 1 を x に人れる */ 

優先順位をあきらかにするために式にかっこをつけてもよい. 

* ( api [ 1 ]) = 2 ; /* 2を y に入れる*/ 

演算子*が式 api [ l ] 全体に作用して， api [ l ] にさし示されるオブジェクトが 
更新される. 

驚くべきことは（少なくとも筆者にとっては）， x は* * api を使って参照する 
こともできる.この場合，配列名は最初の要素へのポインタに評価されるので， 
* api は最初の要素の内容であり，* * api は最初の要素がさし示すオブジェクト 
となる.別の方法でこれを表すと， * api = = api [0] で* ( api [0]) == x であ 
るから， * * api == x となる. 


注1:配列が グローバル か，または static で宣言されるのならば，宣言するときに初期化することが 
できる. 

int x ， y ， z ; 

int * api [3] = | & x , & y , &z }； 




7.1 複雑な宣言 


165 


int 

* a p l [ 3 ]; 

/* 

int ポインタの配列と * / 

int 

x , y # z ; 

/* 

/* 

配列の要素がさし示す */ 
オブジェクトの宣言. */ 

api [ 0 ] 

=& x ; 

/* 配列の初期化 */ 

a p i [ 13 

=& y ; 



api [2] 

=&z ; 




* api [0] =1; /* 1を x に入れる. */ 

*( api [1]) = 2; /* 2を y に入れる. */ 


次のようにみえるだろう： 

x : 

100 : 1 - 

ap 1 : +——>| 



400 : | 

100 i — — — + 

y ： 



I- 

- 1 

200 : |- | 



402 : | 

200 *-| - 

- >| 2 | 



1 ■ 

404: | 

■ i 

300 * — | -+ 

1 -一 1 

z : 



i- 

-1 | 

300 : | - | 




+ - 

->| ? | 

1 - 1 


api 

_ _ 

配列の最初の要素のァドレス 

== 400 

*api 

== api [ 0 ] 

== アドレス 400 にあるセルの内容 

== 100 

* * a p 1 

==* a p i [ 0 ] 

== アドレス 100 1 

こあるセルの内容 

== 1 

* * a p i 

== *api [0] 

== api [0] [0] 




api [1] == api からオフセット1にあるセルの内容 

(メモリ番地402にあるセル） == 200 

*api [1] ==アドレス 200 にあるセルの内容 == 2 

図7 . 1初期化された int へのポインタの配列 


api の宣言を解釈した手順を一般化することができる. 

( 1 ) 優先順位図を使って，宣言を十分にかっこ付けをする.オブジェクトの名 
前はもっとも内側にあるべきである. 

( 2 ) 節を書いて名前から始める•（•••は （ 3 ) の部分） 

名前は， ... である. 

( 3 ) もっとも内側のかっこから外側へ処理する. 

みたもの： 次の説で置き換える： 

* への（複数の）ポインタ 

[ n ] の n 個の要素を持つ，配列 

() (もどる） 

型の予約語に達するまで，本方法を続ける（最後に （3) の部分は逆に読 
んでまとめる）.次に例をあげる. 
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int a ai[3][2] 

は ”2 次元配列”として使うこともできるが，”2次元配列”ではない.本当は何 
であるか理解するために，たった今定めたルールを適用する • 2組の’ []’ はあ 
きらかに同じ優先順位である.しかし，それらは左から右に結合が強い•宣言は 
次のようにか っ こで囲むことができる. 

int ( aai [3] ) [2] 

ルールに当てはめて，内側から外にすすむ.次の結果を得る. 
aai は， 

を3個の要素として持つ配列， 

を2個の要素として持つ配列， 
int 
である. 

つまり， aai は複数の配列の配列である.メモリ中の配置は図 7.2 に示されて 
いる. 

図 7.2 をみると2, 3気がつくことがある.最初は，代入文である . ip = (int 
*) aai ;配列名は，最初の要素へのボインタに評価される. aai は配列の配列で 
あるから， aai の最初の要素は，2つの要素を持つ配列である.一方， ip は，2つ 
の要素を持つ配列へのボインタとしてではなく，ひとつの int へのボインタとし 
て宣言されている.この問題はキャストで回避する.キャストは，コンパイラに 
変数を使用する前に型変換をするように知らせる • aai ( int の2つの要素を持 
つ配列へのポインタ）を単純な int へのポインタに変換したい.変数名とセミコ 
ロンを取り除いた，必要な型の変数宣言をかっこで囲んでキャストを形成する. 
整数ボインタは 

int *ip ; 

のように宣言されるから，さきの手順でキャストをつくると， 

(int *) 

になる.このキャストで aai を処理して，一時的に aai の型を int へのポインタ 
にかえる . aai の内容はかわらない.ただコンパイラの aai の取扱い方がかわる. 

配列の最初をさし示すように初期化された ip は，面白い方法で使うことができ 
る.整数がポインタを通して直接アクセスされるときに，コンパイラは実際にさ 
し示されているオブジェクトが何かわからない.コンパイラが処理しなければな 
らないのは，ひとつの要素へのポインタだけならば， 2 X 3 の整数配列と6要素の 
整数配列を区別できない. aai が直接アクセスされるとき，コンパイラは何であ 


この部分は 
下から上に読む. 
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#define ROWSIZE 3 
#define COLSIZE 2 

int aai[ ROWSIZE ] [ COLSIZE ]; 

i n t * i p ; 

ip = (int *) a a i ; 

*(ip + 2) = 6; 

ip: 

I - I 

100 : | 200 * | 


a a i : V 


200: 

1 

| a a i [ 0 ] [ 0 ] 

== 

* i p 






202 : 


a a i [ 0 ][ 1 ] 


*( i 

P + 

1) 




204 : 

1 

| 6 

--1 

| a a i [1][ 0 ] 

== 

*(l 

P + 

2)== 

* ( i p + 

(COLSIZE 

*1)+0) 

206: 

1 

aai [1][1] 

== 

*( i 

P + 

3)== 

* ( i p + 

(COLSIZE 

*1)+1) 

208: 

1 = = - = = 

1 

--1 

| aai[2][0] 


*( i 

P + 

4 )== 

* ( i p + 

(COLSIZE 

*2)+0) 

210 : 

1 

| a a l[ 2 ][1] 

== 

*( i 

P + 

5) == 

* ( i p + 

(COLSIZE 

*2)+0) 


ip == 番地100にあるセルの内容 == 200 

ip + 2 == : ip は int をさし示すから， ip+2 は4 

(2 *sizeof(int)) を ip の内容に加える . 200+4 == 204 

★(ip + 2 ) ==番地 204にあるセルの内容 == 6 

図 7*2 配列の配列 

るのかわかる（この情報は宣言で規定されていたから）.式 aai [ l ][ l ] と* (ip + 
3) はどちらも同じセルを参照する.これは，配列をはやく初期化したいときに 
は有効である.複合した配列のインデックス （[] を使用したもの）は，3つの 
かけ算が必要である（注 2). そして，ポインタを増加するためにはかけ算は必要 
ない.だから，かなり効率がよい. aai は，図 7.3 にあるル_プを使って初期化 
できる. 

aai のひとつの要素が，実際どのようにアクセスされるかみてみよう. aai は2 


注 2: aai [ i ][ j ] のアドレスをみつけるために，コンパイラは次の計算をしなければならない. 
addr = aai + (i * COLSIZE * sizeof ( int )) + (j * sizeof ( int )) 

ここで， aai は配列のベース•アドレスである. 3回のかけ算と2回のたし算が必要である. 
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#define ROWSIZE 2 
#define COLSIZE 3 

lnt aai[ ROWSIZE ] [ COLSIZE ]; 

register int *ip , i ; 

for( i = ROWSIZE * COLSIZE, ip = (int *) a a i ; --i >= 0; *ip + + = 0) 

図 7.3 簡単なポインタを用いた多次元酉己列の初期化 

つの要素を持つ配列の配列であることを思い出しなさい.つまり， aai [ x ] はこの 
2つの要素を持つ配列のうちひとつをとる.ひとつの配列全体をとる.ただひと 
つの要素を取り出すためには，もうひと組の， []’ が必要である. 

(a a 1 [x] )[y] 

は aai にあるひとつの整数 ( aai [ x ] の配列の y 番目の要素）を選びだす.， [ ]， 
は左から右に関係するから，かっこなしで aai [ x ][ y ] と書くことができる（注 
3). しばらくの間，配列の配列の話題にもどる.他の例をみてみよう. 

1 n t * * p p i; 

また，これにかっこ付けをすると，宣言は下のようになる. 

int *( *pp i ) ; 

内側から外側にみていって，次を得る. 

ppi は， 

への ポイ ンタ 

への ポイ ンタ —逆に読む. 
int 
である. 

2つのアスタリスクに混乱されないように.特に， ppi を “int のポインタのボイ 
ンタ”と思ってはいけない.これはことばの上では意味がないし， C 言語ではなお 
さら意味がない • ppi はひとつの，ポインタの大きさの，オブジェクトである. 
メモリ割当ての点から見ると， ppi が他のポインタをさし示していてもたいした 
ことではない • ppi と ppi を初期化するために必要なデータ構造を図 7.4 に示す. 


注3 :前にも述べたように，かっこを用いた，配列へのランダム•アクセスはとても非効率的な操 
作である.さらに，大きな配列のアプリケーションの多くは，実際にはランダム•アクセスに 
する必要はない•読者は通常は順番に，行ごとか，または，列ごとに配列をアクセスするだろ 
う.だから，いつでも2重のかっこよりも効率のよいポインタと定数を使用したアクセス方法 
を始めることができる. 





7.1 複雑な宣言 


169 


== ppi の!^谷 

==アドレス200 にあるセルの内容 

+ 2 == 300 + (2*sizeof(int)) 

+ 2 ) == アドレス 304 にあるセルの内容 

図 7 • 5 ppi を使う 2 番目の方法 


pi のアドレス == 200 

i のアドレス == 300 

ppi の内容 == 200 

番地200 にあるセルの 内容 == 300 
番地 300 にあるセルの 内容 ==2 

図 7 -4 整数ボインタへのポインタ 


いままでみてきたように， コン ハ。イラはただのオブジェクトへのポインタと 
オブジヱクトの配列の最初の要素へのポインタとを区別できない.いいかえると， 
ポインタを操作するときには，さし示されているオブジェクトが何にみえるか区 


1 nt i array[3], **ppi, *pi ； 

ppi = &pi; 
pi = i array; 

*( *ppl + 2 ) = 6; 


PP 1 : pi: i a r r a y : 

I - I 200: | - | 300: | - 

I 200 *- | - > | 300 *_丨 - > | 


302: | 

304: | 6 


&P i == pi のアドレス == 200 

i array == iaray の最初の要素のアドレス == 300 


i nt *pl; 

i n t * * p p l; 

ppi = & pl;/* ppi は int へのポインタのアドレスを得る 

pi = & i ； / * pi は int のアドレスを得る 

**ppi = 2 ; /* 2 を i に入れる 


100 : 


ppi : 


2 0 0 * - | . 


pi : i 

200 ： |-| 300: | - 

-> | 300 *- |-> | 


0 0 4 
〇 〇 〇 
2 3 3 6 

II II II II 
II II II II 


p p p P 
p p p P 


II II II = II 

II II II II II 


p& p p P 

& p p P 

★ ★ 

* 
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402 

404 


== ppi の内容 ==100 

+ 1== 100 +sizeof ( int ) ==1〇 2 

+ 1 ) ==アドレス 102 にあるセルの内容 == 300 
+1 ) ==アドレス 300 にあるセルの内容==6 

== ppi の内容 == 1〇〇 

==100 4-(2* sizeof ( int )) --104 

==アドレス104にあるセルの内容== 400 
+ 2 == 400+ (2* sizeof ( int )) - - 4 04 

+ 2 ) ==アドレス404にあるセルの内容 == ( 


図 7.6 ppi を使用するもうひとつの方法 


別できない•例えば， ppi は酉己列へのポインタへのボインタにもなることができ 
る.この状態を図 7*5 に示す. 

他の可能性もある.ひとつのオブジェクトへのボインタは，複数のオブジェク 
卜の配列をさし示すこともできる.前の例の中間のポインタ （ pi ) もまた配列で 
ある (図 7.6 参照）•規則はないのだろうか？コンパイラは，何でも追跡する 
わけではない.あるポインタが，配列をさしているのかいないのかおぼえておく 
のはプログラマの責任である. 


n t array_of_ints[3] 
n t *array-of-ptr い ] 
n t intO, inti; 
nt * * p pi ； 

ppi = array.of_ptr; 
array_of_ptr [ 0] = &in 10 ; 

array.of_ptr [1]=&in11; 
array-of_ptr [2] = array_of_ints; 

**(pp i + 1)= 6; 

*( *(ppi + 2) + 2) = 7; 


intO: 


200 : 


ppi: 

I - I 

I 100 *-| 


array_of_ptr : 
100 : 

200 *- 




>1 


102 : 

104: 


300 *- 
400 *- 


300 : | - | 

- >| 6 | 


| array_of-ints: 
400: 


p p p p 
p p p p 


12 2 2 


p p p p p 
p p p p p 
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ポインタへのポインタの別の使い方を考えてみよう.図 7.7 には， main () 
(注 4) の暗黙の引数 argv と argc の配置が示してある.配列 vectors は通常， 
プログラムがブートされるときに root モジュールにつくられる. vectors は，コ 
マンドの引数から組み立てられて， argv で main に渡される. vectors の宣言は 
次のようにかっこ付けされる. 

char *(vec tors[])... 

内側から外にみていって 


vectors は， 

(不定長の）配列' 

へのポインタの一逆に読む. 
char 
である. 

配列の長さは初期化で定義される.初期化の並びに3つのオブジェクトがあるか 
ら， vectors は3要素長である.これらのオブジェクトのおのおのは各文字列の 
最初の文字へのボインタに評価される.変数 vectors は3つの文字配列ではなく. 
3つのボインタに初期化される. vectors はボインタの配列であるから，その名 
前はボインタへのボインタに評価される.それで， argv への代入は難しくなる 
(argv もまたボインタへのポインタであるから）.最後に， argc は argv にある要 
素の数を保持している.式 

sizeof(vectors) / sizeof(*vectors) 

は，バイトで表した配列の大きさを，バイトで表した配列の最初の要素の大きさ 
で割ると，要素の数になる. 

argv のいくつかの使用例を，図 7-7 の下のほうにあげている. argv は vectors 
の最初の要素へのポインタであり，配列名は配列の最初の要素へのポインタであ 
るから， vectors と argv はこれらの例では互いに交換して使用できる. 

*argv は argv にさし示されるオブジェクトで， vectors [0] の内容である. 

注4 : main () の引数を使っても使わなくても， main () は必ず2つの引数をスタックにおいている. 
後でそれらをどのように使用するのか調べる.最近のコンパイラには第3の引数 envp がある. 
この最後の引数は，文字列ポインタの配列へのポインタである.各文字列ポインタは環境変数 
の文字列を保持している.文字列ポインタの配列の最後の要素は NULL である（つまりそこに 
は環境変数はない）.引数は次のように宣言されている. 

main ( argc , argv , envp ) 
int argc ; 
char 氺 * argv ; 
char 本* envp ; 
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char *vectors[ ] = -C "first", "second", "third" >; 


char 
i n t 

* * * a r g v = vectors; 

argc = sizeof(vectors)/sizeof( 

* vectors) 

# 


argv: 

vectors: +- 

->|，f • | 

'i ' 

| ' r ' 

1 'S' I 

• f i 

1 '\ 〇 ' 1 

i - 

1 *- 

-| 1 _ - - 1 1 

1 - 






1 - 

| - 1 

* _ I _ 

- >1 's' | 

| ' e ' 

| ' c ' 

1 ， 0, 1 

'n ' | 

| ' d ' | ' \0' 

argc : 

1__ 

1 - 1 

— 1 I mm mm 1 mmm av Mi + 

1 _ - 






1 3 

1 







1 1— - 1 1 

■ 1 4 -— 

1 - 

- > I > t 1 1 

1 * h 1 

1 • i ■ 

m r 1 1 

'd ' 

1 ' \0' 1 
- | 

1 - - 

1 ^ 

^ 1 L 1 
1 —— 


1 1 

i ' i 


argv は vectors の最初の要素をさし示しているから，次の5つの例のように 
argv と vectors は互いに交換できる. 

* argv = = vectors [0] ==文安列 first へのポインタ 

* * argv = = * vectors [〇] = = argv |_0 J [〇] == 文罕 ’ f ’ 

* ( argv +1) 二 = vectors [1] ==文字列 second への ホ インタ 

** ( argv +1) ==* vectors [1] == argv |_ l 」[0] ==文字’ s ’ 

* (* ( argv + l )+2) = = * ( vectors + l )[2] = = argv [ l ][2] ==文罕 ’ c ’ 

図 7 . 7 argv 


argv と vectors は交換可能であるから， argv [0] とすることができる •[] 表 
記はボインタにオフセットを加えて計算されたアドレスにあるオブジェクトをと 
り出すように，コンパイラに指示しているだけである. argv は文字列ポインタで 
あるから， puts (* argv ) を呼出して文字列 first をプリントすることができる. 

次の式は argv にオフセット1を加えて vectors の2番目の要素をアクセスす 
る . *(argv + 1)， * (vectors +1)， argv [ l ], vectors [1] も同様である•式 
puts ( * (argv +1))は文字列 second をプリントする • argv は変更されない. 
たし算は一時的な変数で行なわれる. 

* argv は vectors の最初の要素の内容に評価されるから，* (* argv ) (かっ 
こは必要ない）は vector の最初の要素によってさし示されているオブジェクト， 

，’ first ” の文字， f ’ になる.同様に， * (argv +1) は配列 vectors の2番目の 
要素であるから ， **(argv + 1) は vectors の2番目の要素， second " の文 
字’ s ’ になる. 

最後は* (* (argv + 1)+2) である.内側から外へ処理すると ， *(argv + 
1 ) は，オブジェクトひとつ分のオフセットが argv に加えられた後， argv にさし 
示されるオブジェクトである.それは vectors の2番目の要素 （vectors [1])で 
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argv : 

argv はこの * (argv + l )+2 はこ 

セルの内容 こをさし示している 

1 * (argv + 1) +0はこ | 

1 こをさし示している 1 

1 "一 1 

|| II 


1 1 

1 -- I 

-> 丨 1 1 1 


i i 


' o ' l ' n ' I ' d ' I ' XO'l 

1 

— 1 1 ク丨 s | e | c | 

i 

1 

1 

*(argv + l ) は 
このセルの内容 

III 

II II 

| —1 1 1 

1 1 

1 i 

1 

1 

*(argv + l ) + l はこ 
こをさし示している 

■ - * ( * (argv + l )+2) 

はこのセルの内容 


図7 • 8 *(*(argv + l )+2) 




argv: 

1 - 

1100* 

1 - 

-1 

- | -+ 

-1 1 


100: 

1 

I - v - I 

1 1 


102: 

1 1 I I 

| 200 *- 1 - > I ' s ' I 

200 

104: 

1 1 1 1 

1 1 | 1 e ' | 

1 1 II 

201 


1 1 1 1 
| ， c • | 

202 


1 — 1 
| ' 0 ' I 

1 - 1 

203 

argv 

== argv の内容 


*a r g v 

==番地 100 にあるセルの内容 


argv+1 

== argv の内容 + (1 *sizeof (char : 


== 100 + 

2 

* (argv+1 ) 

==102 

==番地 102 のセルの内容 


* (argv+1 ) 

== 200. 

+2 == 200+2 



202 


*( *(argv+1) +2 ) 


番地202のセルの内容 

'c ' 


図 7 . 9 * ( * (argv + 1) + 2) Shown With Addresses 
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ある. vectors [1] は，” second ” の最初の文字 （’ s ’） へのボインタである.この 
ポインタに2を加えて，’ second ” の3番目の文字 （’ c ’） をさすポインタをつく 
る.しかし，いままでのところでは， c ’ へのポインタを得ただけである.もっと 
も左に*を加えると’ c ’ 自体になる.それで， putchar ( * ( *argv + 1) +2)) 
は’ c ， をプリントする.この例は図 7.8 に詳しく書いている.図 7.9 は同じ例 
だが，実際のアドレスを入れてある. 

*(ptr + i ) は ptr [ i ] で表されるから，この文はかなり簡単にできる.そのル 
ールを1回適用すると，次のようになる. 

* ( ptr +1 ) == pt r い ]; 

*( *(argv+1) +2 ) == *(argv + 1)[2] 

もう 1 回それを適用すると，次のようになる. 

*( ptr + i) == ptr [ 1 ] ； 

*( argv +1 )[2] == argv [ 1 ] [2] 

面白いことに，2つのポインタを通して文字列にアクセスするために，2次元 
配列をアクセスするためによく使ったものと同じ表記のしかたを使用している. 
しかし， argv は2次元配列とはまったく違う.だからなおさら配列自体は本当に 
存在しないということになる. 

argv は変数だから， vectors のさまざまな内容と同様に，変更することができ 
る.図7.10に式 

++ * ++argv; 

の結果を示す.この式は，かっこで囲むと + + (*( + + argv )) になり，2つの 
ことを行う.もっとも内側の+ +は argv に接しているから， argv は増加して， 
vectors [ l ] をさし示す.前置きインクリメント（識別子のまえに+ +がある） 
だから， 続くすべての 動作は増加後の argv の 値を使う. * が次に評価され，外側 
の+ +は* argv (増加後の）に適用される.再び前置きインクリメントであるが， 
それにより増加した argv にさし示されているオブジェクト自体が増加する（今度 
は Second ” の， e ， がさし示される）.， e ， をその ポインタで アクセスするには， 
もうひとつ*が必要である.この動作を図 7*10 に示す. 

図 7-10 の下方にある例の中で，まだみたことがないものがひとつだけある. 
その式** (argv -1) は， argv の現在の値から1オフセツトひいて ， vectors 
[0] をさし示すポインタをつくる•すなわち，* (argv —1) は (argv —1) に 
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さし不される オブジェクト であり，その オブジェク トは argv から 1オブジェクト 
の大きさをひいたアドレスにある.式** (argv — 1) は vectors [0] にさし示 
される オブジェクト， ’’ first ” の’ f ， である •一 1 は， []， の中にも使用できて 
(* argv [- l ]， argv [- l ][0] にあるように），負の オフセットを 表す. 

図7.10の最後の例は，_1のさきの例とは違った使い方を示している.これは 
— 1 を argv 自体にではなく， *argv (argv がさしているオブジェクト）に適用し 
ている. *argv は second ” の， e ， へのポインタであるから， （* argv ) _i 
は’ e ， の前の文字， s ， をさすポインタである.つまリ *((* argv ) — D け 
そのアドレスにあるオブジェクト， s ， である. 


次の命令を実行する 

++ * ++argv 

argv と vectors は次の関係がある. 


*( + + a r g v 
150: 


argv : 
102 


vectors: 
I 


- > | '1 


102 : 
- > 

104: 


150 

* - 

201 * -- 

250 

* - 


'\ 0 ' | 


I 


200 201202 203 204 205 


I '\0' 
206 


250: 

I —— 

->1 'f | 

I —— 


' h ' | ' i • | ' r ' | ' d ' 

argv 100 ( vectors [0] のアドレス）を含んでいるところから始まる 

+ + argv 10?から102に argv を増加する（ポインタの計算が行われた） 
アドレス102にあるセル ( vectors [ lj ) をさすようになる.'", 

* + + ar 9 v 増加した後さ！^示されているオブジェクトの内容，番地1〇2に 


1 \0 • | 


+ + * + + argv このセルを 200 から 201 に増加する. 
+ + * + + argv アドレス 201 にあるセルの内容，， e ， 


をさすようになる. 


この 時点（全部の 増加が終わった後）で，次の恒等式が成り立っ 


*argv 
*(argv+1) 

**arg v 
**(argv+ 1 ) 
*(*(argv+1)+2) 
**( argv - 1) 

* ( (*argv)-1) 


vectors[1] 
vectors[2] 
*vectors[1] 
♦vectors[2] 
*(vectors+2)[2] 
*vectors[0] 
vectors[1][-1] 


== 文字列 ’’ second ” へのポインタ 
== 文字列 ” third ” へのポインタ 

== argv [0] [0] == 文字’ e ， 
== argv [ 1 ] [ 〇 ] == 文字， t ， 

== argv [ 1 ][2]== 文字， i ， 
==argv [-1] [ 〇 ] == 文字， f ， 
==argv [0][-1]== 文字， s ， 


図 7 .10 argv のインクリメン 
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別の例をみてみよう. 

1 nt (* pa 1 )[ 3 ] ; 

ここには，宣言の一部としてかっこが使われている•まず，もっとも内側のか 
っこをみてみると，次のことがわかる. 


pai は， 

への ポイ ンタ， 

の3つの要素を持つ配列 
int 
である. 


—逆に読む. 


またポインタは宣言されているだけである（結局は酉己歹 1 1をさし不すのたか， 
まだ 今のところはそうではない）. pai が図7.11(注 5) で初期化されている. 



int 

int 

い 

a 

を pai ) [ 3 ] ; 
i [3] ; 

/* ポインタの宣言 */ 
/* 配列の宣言 */ 




pai 
**pa i 
(* p ai )[1] 

*(*pai + ; 

= a i ; 

= 0; 

=1; 

2) = 2; 

/* 初期化 */ 

/* 使用 */ 



次のよ- 

5 にみえる 






pai : 

+ 

1 

a 

10 0 | I 

i : 




1-- 1 

| 100 *- | 

1 1 
|-->l 

ii 


0 | ai 

[ 〇 ] == (*pa i ) [ 0 ] == 

* * p a i ; 


1- 1 

II 

1 

102: | 

1 | a i 

[ 1 ] == (*pai)[ 1 ]== 

* ( *pai + 

1) 


1 

1 

104: | 

2 | a i 

[2] == (*pa i ) [2]== 

* ( *pa i + 

2 ) 


4 - 

図 

7 - 11 int の配列 

へのポインタの初期化 




pai は配列へのポインタであるから，そのさし示されるオブジェクト （* P al ) 
け配列の1要素ではなく，配列全体である（注 6 ).その配列の1要素にアクセ 


注 5 :次のように ai と pai を初期化することもできる. 

int ai [3] = 1〇，1，; 

int (* pai ) [3] = ai ; 

注 6 :このため，多くのコンパイラ（例えば， Microsoft compiler ) は次のような代入文には文句をいつ. 

pai = ai ; 

ここで問題なのは，配列名でぁる ai が配列の最初の要素へのポィンタに評価されること，ニニ 
り int へのポインタに評価されていることである. P ai は int 1 個へのホインタではょ上:= 
へ’ のポィンタでぁるから，〕ンパイラは型が違うと思う.この問題はキャストを用いて回避する 
ことができる.いいかえれば， ai を 3 つの要素も配列へのポインタにキヤストする. 
pai = (int ( * ) [3] ) ai ; 
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スするには， pai ではなく， * pai にインデックスをつけなければならない （[] 
表記を加える） •[] はアスタリスクより高い優先度を持つから，かっこが必要 
である. ai [ l ] は （* pai )[ l ] でアクセスできる. 

これを一段すすめてみよう.配列の最初の要素 （ ai [0]) は， （* pai )[0] でア 
クセスすることができる.ポインタの右に [0] があるが，その表示を，ポインタ 
の左に * をおく表示にかえることができる.したがって， （* pai ) [0] は* * pai 
でもアクセスできる.たった今適用したルールは 

p[ i ] == *(p + 1 ) 

の変形した場合だから，この等式の p を （* pai ) で置き換えて，次式を得ること 
ができる. 

(*pai )[ 1 ] == *( (*pai ) + i ) 

再び異なる角度からこの例をみてみよう . c 言語ではすべての式は何かに評価 
され，その何かは限定された型である. pai はその内容100に評価される. pai は 
int の配列へのポインタである. * pai は int の配列へのポインタによってさし示 
されているオブジェクトである. * pai は ’ int の配列”という型である.配列は 
通常名前で参照され，その名前は配列の1要素へのポインタに評価される.この 
例では* pai は配列全体を参照している.だから， * pai は配列名のように，配列 
の最初の要素へのポインタ，その最初の要素のアドレス100，に評価される . pai 
と * pai は同じ数，100に評価される.しかし， pai 自体は int の配列へのポイン 
夕型であり，一方 * pai は int の配列型である. * pai は int の配列型であるから， 
** pai は int 型であり，それは配列の最初の要素に評価される. 

pai のもうひとつの特徴がある.さし示されているオブジェクトは配列全体で 
あるから，そのオブジェクトの大きさは配列全体のバイトでの大きさである.ポ 
インタ計算は pai がインクリメントされるときに行われ，さし示されているオブ 
ジェクトの大きさ（配列全体の）が pai の内容に加えられる . 2八イトの int だと 
すると，3つの要素を持つ整数の配列の大きさは6である. pai をインクリメント 
すると，図7.12のように配列全体をとび越えてしまうことになる.この動作は， 
配列の配列に適用されるとき意味を持つようになる（図 7-13 をみよ） • pai はそ 
こでインクリメントされ，最初の副配列を通り越して2番目の副配列をさしてい 
る. 

pai について今おぼえたことを2次元配列に応用してみよう . aai [ x ] (ひと組 
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1 n t ( * p a i ) [ 3 ] ; 

i n t a i [ 3 ]; 

+ + p a l; 


/* ポインタの宣言 */ 
/* 配列の宣言— */ 
/* 次のことを行う */ 


pa 1 




図7 . 12 int の配列へのポインタをインクリメントする 


1 n t 
int 
+ + p a 1 

pa i : 


(* pai ) [3] ; /* 

aai[2][3]; /* 

/* 



ポインタの宣言 */ 

配列の 宣言 */ 

次のことを行う */ 

a a i [ 0 ] [ 0 ] 
aai[0][1] 
aai[0][2] 

a ai[1][0] == (* p ai)[0] 
aai [1][1]==(*pai )[1] 
aai[1][2] == (*pai)[2] 


図 7 .13 配列の配列に使用されている int の配列へのポインタ 


= * * pai 


の [] だけがある）は3要素の配列全体を参照する.だから，3要素の配列への 
ポインタであるかのように使用できる. pai は，次の文で配列の2番目の要素を 
さすように初期化できる. 


pai = aai [ 1 ] ; 

いいかえれば， aai は複合配列である.ひと組の [ ] をもつ配列名は，副配列 
全体へのポインタに評価される.配列全体への参照は，その配列の最初の要素 
へのポインタに評価されるから， aai [ i ] も int へのポインタのポインタ型である. 
さらに，この部分的な参照は，それだけでポインタとして使用できる•いいかえ 
れば，恒等式 


(p + i ) 


p[i] 


















を 
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p [ ]_••[ ][ i ] = = (p C ]••_[]) [ i ] == *( (p [ ]••■[]〉+ i ) 

に拡張することができる•別の方法をみてみよう•恒等式は [] がなくなるま 
で続けて適用できる. 

a a 1 [i ] [ j] == * ( ( a a i [ i ] ) + j) == *( *( a a i + i ) + j ) 

さまざまな関係が図 7.14 に示されている. 3 要素の配列への，どのボインタもこ 
れらの例では aai に置き換えて使用できる. 

すべてのかっことアスタリスクは， [] を用いた表記の実用性の核心を突い 
ている.筆者が思うには， aai [ l ][2] のほうが* ( *(aai + 1) + 2) よりも読 
んでわかりやすい.一方で，2番目の式の方がコンパイラの実際の動作に近い. 


//define ROWSIZE 2 
#define COLSIZE 3 

int aai[ ROWSIZE ][ COLSIZE]; 

aai[i][j] == *( (a a i [ i ] ) + j) == *( *(aai + i) + j ) 


aai[0][0] == *( 
aa l[0][1 ]==*( 
aai[0][2] == *( 
aai[1][0] == *( 
aai[1][1 ]==*( 
aai[1][2] == *( 


a ai[0]) == 

(aa i [0] ) + 1)== 
(aai[0]) + 2 )== 
a a l[1]) == 

< a a i [1]) + 1)== 
(a a i [1]) + 2 )== 


* * a a l ; 

* ( * a a l +1 

* ( * a a i + 2 

*( *(a a i + 1) + 0 
*( *(aa l + 1) + 1 
*( *( a a i + 1) + 2 


図 7 •14 配列の配列 


7.2 関数ポインタ 

C 言語は別の種類のポインタ（関数ポインタ）をサポートしている.ちょうど 

int (* array)[] ; 

は int へのポインタを宣言しているように 

int (* p f 1 )() ; 

は int をかえす関数へのポインタを宣言している.どちらの宣言にも，かっこが 
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必要である.かっこがなければ， array はポインタの配列になってしまうだろう 
し， pfi は， int へのポインタをかえす関数になってしまうだろう.みてきたよう 
に，配列名は，いつも配列の最初の要素のアドレスに評価される.同様に，関数 
名はいつも関数の最初の命令コードのアドレスに評価される.このアドレスは関 
数ポインタにおくことができ，そのポインタは，関数を直接呼びだすときに使う 
ことができる.図7.15では，それがどのように行われるかを示している. 


int 

foo ( 

/ if 

a, b 

ic / 

> 

/ - 

• • / 

m a 1 n ( 

) 



int 

(* 


int 

X , 


1 累 • 

pfi 

• - / 

= foo; 


p f i 〉 （ x , 


p f 1 )()； 

y ; 


y 


/ * foo へのポインタ pfi を初期化する*/ 
/* foo ( x , y ); と同じ */ 


図7 . 15関数へのポインタ 


代入文 pfi = foo には， foo に続くかっこがないことに注意しなさい.かっこ 
があれば， foo が呼びだされて， pfi は foo () がかえすどんな値でも保持するよ 
うに初期化されるだろう.かっこがなければ，サブルーチン名はそのサブルーチ 
ンのアドレス （[] なしの配列名が，その配列のアドレスに評価されるように） 
に評価され，そのサブル_チンは呼びだされない（注 7). ある関数が次の文でポ 

インタを通して直接呼びだされる. 

(* pf 1 )(args ) ; 

” pfi にア ドレスが 含まれている関数を呼びだす”.ここでもかっこは必要であ 
る.次の例は，その理由をもっとも簡単に示している. 


extern int *func t(); 

x = *func t(); 

ここでは，宣言は次のようにかっこ付けできる. 

注7 :初期の Lattice C はバグのため ， pfi = & foo と書かざるを得ない. 
実際は&は必要ない. 
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extern in t *( func t ())； 

それで， funct は int への（ポインタをかえす）関数である•文 x = *funct () 
は funct () がかえすボインタがさしているオブジェクトの内容を x に入れる. 
つまり， funct () は int のアドレスをかえし， * funct () はその int に評価さ 
れる. 

関数ポインタは，関数の配列をとることができない点で，他のポインタとは異 
なる（関数ポインタの配列はできるが，関数自体の配列はできない）.したがっ 
て，関数ポインタをインクリメントすることは規則違反になる（実際には，関数 
ポインタでのすベての算術演算が規則違反になる）. 

関数名にかっこがつけられていないときには，いつも関数ボインタであること 
が暗に示されていることに注意する必要がある.例えば，サブルーチン laurel( ) 
と hardy () は同じ引数を持ち，次のように書ける. 
extern int laurel ( ) , hardy(); 

(*(condition ? laurel : hardy) )( arg1,arg2, arg3 ); 

condition (条件）が真であるかどうかに関係して， laurel () か hardy( ) が 
呼びだされる.どちらでも，同じ引数が呼びだされた関数に渡される.かっこの 
ない関数名が引数であるので，条件自体は関数へのポインタに評価される. * が 
関数ポインタを通して，直接その関数を呼びださせる.さきの例は次のように書 
き直すことができる. 


extern int l aurel( ), haray(); 

int (* ptr)(); 

ptr = condition ? laurel : hardy ; 

(*ptr )( arg1,arg2, arg3 ); 

ここではサブルーチン呼出しのかっこも演算子である.そのかっこはサブルー 
チン名の一部ではない.つまり，かっこ演算子はサブル_チンの呼出しを生成す 
るために，どの関数へのポインタにもつけることができる.配列名が，その配列 
の最初の要素へのポインタに評価されるように，サブルーチン名は，関数へのポ 
インタに評価される. [] が，配列要素へのどんなボインタにもつけることがで 
きるように， （） も関数へのどんなポインタにもつけることができる. 

関数ポインタは，使い方がいくつかある.その使い方は，ジャンプ•テーブル 
やルックアップ.テーブル（構造体の配列，その構造体のひとつの フィ ールドが 
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1 

void 

argv_sor t( argc 

,argv ] 

1 


2 

i n t 

a r g c ; 




3 

char 

**argv; 




A 






5 


/ * シェル.ソートを使用して argv をソートする 

*/ 

6 






7 


register int 

i / i; 



8 


i n t 

gap, ki 



9 


char 

**p1,^ 

k *p2, * tmp ; 


10 

11 


for( gap = argc 

>>1 ; 

gap > 0 ; 

gap >>=1 ) 

12 


f or ( i 

=gap; 

i < argc; i ■( 

卜 + ) 

13 



f o r ( j 

=i - 9 a p ; j 

>= 0 ; j -= gap ) 

14 






15 




pi=argv 

+ j ； 

16 




p2 = argv 

+ ( j+gap ); 

17 






18 




i f C s t r cmp( *p1,*p2 ) <= 0 ) 

19 




break; 

20 






21 




tmp = *p1 

/* 2 つの要素を交換する 

22 




*p1=*p2 


23 




*p2 = tmp 


24 



> 



25 

> 






図7 . 16汎用目的でないシェル.ソート 


キーで，もうひとつの フィ ールドはそのキーに出会ったとき呼びだされる関数へ 
のボインタになっている），オブジヱクト志向プログラミング（関数が特定のオブ 
ジェクトに対して特別な情報を持ち，その情報を関数へのポインタを通してサブ 
ルーチンに渡すことができる）にある. 

この最後の使用法のよい例は， ssort ( )， UNIX の qsort () をモデルにした 
汎用のシェル.ソート•サブルーチンである.汎用目的の ssort () をみる前に， 
argv をソートするためにつくられたプログラム， argv _ sort をみてみよう（図 

7*16 参照）. 

もしシェル.ソートがどのように動くのかよく知らなければ，このまま続ける 
前に Appendix B にある記述をみるべきである. 

argv _ sort は， argv をソートするためにつくられたシェル•ソートである • pi 
と p 2 は，1回通す間に考えられる2つの要素へのボインタである.この2つのポ 
インタは，図7.16の15,16行で初期化されている.ポインタの計算が行われて， 
argv -h j は argv [ j ] のアドレスに計算される.同様に ， argv + (j + gap ) は 
argv [j + gap ] のアドレスに計算される. 2つの要素は， strcmp () を使って 
比べられる • strcmp () は， * pl < * p 2 ならば負の値をかえし， * pl == * p 2 
ならばゼロをかえき， * pl > * p 2 ならば正の値をかえす. pi と p 2 は argv 配 





7.2 関数ボインタ 
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列へのポインタである.したがって，それらは文字ポインタへのポインタである. 
strcmp () は引数として単純な文字ポインタが必要である.だから，間接的レ 
ベルは strcmp () で1レベル取り除かれていなければならない. 2つの要素は 
21〜23行で交換される. 

基本的なシヱル.ソートを真の汎用目的にすることができる（つまりどんな配 
列も，ポインタの配列，構造体の配列等，ソートすることができる）. argv_sort 
() にこのような能力を与えるには2つの変更が必要である.第一に，配列のひ 
とつのセルの大きさをバイト数で教える必要がある. argv _ sort () には，この情 
報は配列宣言に暗示されている.つまり，文字配列へのポインタとして定義さ 
れているから，コンパイラは配列の各要素が文字ボインタの大きさであること 
を知って，ボインタ計算を正しく行うことができる.汎用目的のルーチンは， 

コンパイル時にひとつの要素の大きさを知ることはできず，実行時までその情報 
がないからポインタ計算をすることができない.だから，そのソート•ルーチン 
にはひとつの要素の大きさをパラメータとして渡し，ボインタ計算をしなければ 
ならない. 

汎用目的のルーチンに必要な第2の情報は，比較ルーチンへのボインタである. 
argv _ sort () は， argv をソートしていることがわかっていたから，直接 strcmp 
() を呼びだすことができた • ssort () は，ソートされるオブジェクトの大きさ 
以外その情報を何も知らないから， strcmp () を直接呼びだすことはできない. 

strcmp () にかわる比較ルーチンが必要である.配列の要素がどのようなもの 
かを知り，その2つの要素を比較することができるルーチンが必要である.この 
比較関数はソートされる配列の種類各々に対して代わり，その関数へのポインタ 


Given: 

int array [10 ]; 

cmp(lp1,ip2 ) 
i n t * i p 1 # * i p 2 ; 

return *ip1 - *ip2 ; 

> 

次の文で配列はソートできる： 

ssor t( array,10, sizeof(int ), cmp 


図 7 .17 int の配列をソートするための ssort の使用 
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をソート •ル— チンに渡す.ソートしたい配列の種類によって異なる比較関数を 
書かなければならない.その比較関数は，2つの配列要素へのポインタを渡され 
ることができ，それ以外は strcmp () のように動くべきである. 

ssort () で argv をソートするとき，比較関数は argv の要素への2つのポイン 
夕を渡される.間接を1段取り除き， strcmp () を呼びだして比較する . into 
配列をソートするとき，比較関数は int へのポインタを渡され， int 自体を比較す 
る（ボインタを通して関接的に）.構造体の配列をソートするときは，比較関数は 


cmp( cpp 1, cpp2 ) 
char **cpp 1,**cpp2 ; 

return strcmp( *cpp 1,*cpp2 ); 


m ain( argc, argv ) 
int argc; 

char **argv; 

< 

ssor t ( + + argv, --argc , sizeof(*argv) , cmp ); 

while C --argc >= 0 ) 

prlntf(" % s\n" f *argv + + ); 

> 

図 7 •18 argv をソートするための ssort () の使用 


Given: 


tyDedef struct 

int key, elemen11 , elemen12, etc; 

> 

ELEMENT; 


ELEMENT array [10]; 


compa re( el,e2 ) 

ELEMENT *e1, *e2; 

て 

return( e1->key - e2->key ); 

> 


次の文で配列はソートできる： 

s sor t( array, 10, sizeof(ELEMENT), compare ); 

図 7 •19 構造体の配列をソートするための ssort の使用 
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void ssor t( base, nel, width, cmp ) 

char *base; 

int nel, width; 

i nt (*cmp)(); 

i 

/* 汎用目的シェル • ソート： 


Base .. は格納される配列のベース•アドレス 
neL ... 配列にある要素の数 
width . ひとつの要素のバイトでの大きさ 
cmp ... 比較する関数へのポインタ， 

次の式で呼びだされる . 

x = (* cmp)( a, b ) 
ここで， a と b は 2 つの要素へのポインタ . 
次のようにリターンする . 

x < 0 ならば， a < b 

x == 0 ならば， a == b 

x > 0 ならば， a > b 


register 

int 

char 


int 


gap, k, tmp 
*p1, *p2 ； 


for C gap = nel >>1 ; gap > 0 ; gap >>=1 ) 
for( i = gap; i < nel; i++ ) 

for ( j =l-gap ; j >= 0 ; j - = gap 




base 

base 


((j 


* width); 
卜 gap) * width); 


if < (*cmp)( pi,p2 

break; 


f or ( 


width;——k >= 


tmp 
*p1+ + 
*p2 + + 


*p1; 
*p2; 

tmp; 


構造体への 2 つのポインタを渡され，構造体のキー•フィールドを比較する•こ 
の3つの状態が図7.17, 7.18, 7.19に示されている • ssort () は図7.20に示 
されている. 

今述べた蛮更がここにはすべて組み込まれている. base は2行目で文字ポイン 
夕として宣言されている. char は1バイト幅であるから，文字ボインタのポイン 
夕計算は普通の計算と同じである. char へのポインタにさし示されているォブ 
ジェクトの大きさは1である.それで， pi と p 2 を初期化するとき（29, 30行目）， 


123456789012345678901234567890123456789012 

111111111122222222223333333333444 


図 7 • 20 ssort( ) * 凡用目的のソート.ルーチン 
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配列の1要素の大きさとして width をパラメータに使って，ポインタ計算をする 
ことができる. argv _ sort () では，コンハ。イラが通常のポインタ演算を使っ 
て初期化していた. strcmp () を使う代わりに， ssort () はさきに説明した比 
較関数を使う，32行目で直接それを呼びだす.最後に，2つのオブジェクトは間 
接的に1バイト交換されなければならない（実行時まで1要素の大きさがわから 
ないから）.この交換は35〜40行目にある for ループで行われる. 

7. 3逆の手順 

いままで複雑な宣言を解釈するしかただけをみてきた.このセクションは，そ 
の逆のやり方の例をあげ，変数の宣言をする.手順はいままで使っていたものと 
同じだがすべての段階が逆転する.変数を宣言するには 

( 1 ) 何を宣言しようとしているか書く.データ構造が複雑ならば，図を書く. 
これは，何をしようとしているかわかるのに役立つ•図には，実際に宣言 
するオブジヱクトの名前を丸で囲む. 

(2) オブジェクトの名前を書きだす.そのオブジェクトがボインタであれば， 
名前の横にアスタリスクを書く.配列ならば，右横に [] をかき，その 
中に数を入れる.最後に，書いたもの全体をかっこで囲む. 

(3) この手順を続け，名前から始める.図を書いていたらポインタが参照する 
矢印の方向へ進む. 

2, 3の例をあげる. int の配列へのポインタの配列へのボインタである変数名 
papa は，次のように宣言される. 


papa 


(*papa) 


((*papa)[]) 

(*((*papa)[])) 


(*((*papa)[]))[] 


int (*((*papa)[]))[] 


名前を書く. 

ポインタである.それでアスタリスクとかっこを加え 
る. 

papa は何へのボインタか？ 配列.それでは ’[] ，と 
かっこを加える. 

何の酉己列か？ ポインタ.それで，もうひとつアスタ 

リスクとかっこを:^える. 

何へのポインタか？ 配列.それでは，2組目の’「1’ 
が必要である. 

何の配列か？ int ， それでは単語 int を書いて，終わ 
り. 


7.4 typedef 
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この例では，アスタリスクが’[]，より優先度が高いから，すべてのかっこが必 
要である. 

別の例は， long へのポインタをかえす関数へのボインタの配列へのボインタで 
ある too_complex という変数を宣言するために，次のことを行う. 


too_comp l ex 

名前を書く. 

ポインタである.それで，アスタリスクを加える. 

(*too_comp L ex) 

配列へのポインタである.それで， ’[]’ を加える. 

((* too_compL ex )[]) 

ポインタの配列である.それで，別のアスタリスクを 
加える. 

(*((*too_compLex)[])) 

関数へのポインタである.それで関数を示す一組のか 
っこを加える. 

(*((*too_complex)[]))() 

ポインタをかえす関数である.それで，もうひとつア 
スタリスクを加える.関数に必要な （） は*よリ優 
先順位は高いから，ここにもう一組のかっこは必要な 


*(*((*too_complex)[]))() 

long へのポインタである.それで，単語 long を加え 
る. 

long *(*((*too_compLex )[]〉〉（ ） 

最後の例は，内から外への宣言の仕方を説明するために，関数へのポインタを 
かえす関数の宣言を取りあげている.関数へのポインタをかえす関数を宣言する 
には，代わりに double を返す（つまりさし示される関数は double をかえすよう 


にする. 


f unc t 

名前を書く. 

funct は 2 つの引数， a , b を持つ関数である. 

func t(a , b) 

ポインタをかえす関数である.アスタリスクを加える. 

() は*より優先順位が高いので，かっこは必要ない. 

*func t(a , b) 

しかし，返リ値は関数へのポインタである.ここでは， 
かっこが必要である. 

(*funct(a,b))() 

最後に， funct がかえす返り値にさし示される関数は 
double である. 

double (*funct(a,b ))( 

) 

通常，関数の引数の型を宣言する. 


double (*funct(a,b))() 
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7. 4 typedef 

あまリ複雑な宣言は，一般にはよい考えとはいえない.それらは，解釈するの 
が難しすぎる（そして宣言するのも難しい）.複雑な宣言の代わりに，中間の型を 
つくる typedef を使うのが好ましい. typedef はすでに定義された型にかわって， 
新しい型を定義するのに使う.例えば，”10個の int の配列”に対する型は 

typedef int INTARRAY[10] ; 

でつくることができる.構文は単語 typedef が前におかれる以外は通常の宣言文 
と同じである. INTARRAY は実際の型であり 


int key; 

INTARRAY array; 

> f 〇 〇 ； 

にあるように，変数宣言に使うことができる.式 sizeof ( INTARRAY ) は20 (10 
個の int の大きさ）に評価される. 

INTARRAY 型を他の型をつくるのに使うこともできる. 20,10要素の配列の 
配列をつくりたいとき 

typedef INTARRAY 2D[ 20 ] ; 

とすることができる. 2 D は INTARRAY の20要素長の配列であり，# INTAR ¬ 
RAY は10要素長の配列である.前に宣言した配列 papa を宣言し直すのに同じ 
手順を使うことができる （ papa は int の配列へのポインタの配列へのポインタで 
ある）. 


typedef int A I [10]; /* 10 個の int の酉己歹 ij * / 

tyDedef AI * ( API [20] ) ; /* 配列への 20 個のポインタの配列 */ 

/* */ 

API *papa ; / * 上の配列へのポインタ */ 

typedef のもうひとつのよい使い方は，複雑な宣言文を持つ関数へのボインタの 
ようなォブジヱクトに使う.例えば 

typedef int (* PF I)(); 

は” int をかえす関数へのボインタ”の型をつくる.今後は，”関数へのポインタ 
の配列”を複雑な 


7.5 


—ドウェアとやりとりするためのボインタの使用 


189 


int (*functions[20])(); 


J ： りも 


で宣言することができる. 


functions[ 20 ] ; 


関数ボインタの配列へのボインタは 

1 nt ( *(*pfunct)[])(); 


ではなく 


PFI (*pfunct)[]; 

で宣言することができる. 

typedef は，特に，キャストを書くときに有効である. 

( 1 nt (*)( )) X p 


と書くよりも 

(PFI ) xp 


のほうが理解しやすい. 

typedef は次のように，構造体の宣言でも有効である • 

typedef struct _tnode 

char *k ey; 

struct _tnode * rig h t ; 

struct _tnode *lef t ; 

> LEAF; 

LEAF は次のようなことをするのにも使える. 

LEAF * r 〇 〇 t ; 

LEAF heap [10 ]； 

root = (LEAF *) ma11oc( sizeof(LEAF)); 


7 . 5 ハードウエアとやりとりするためのポインタの使用 
7.5.1 絶対メモリ•アドレッシング 

絶対メモリ•アドレスはポインタを通してアクセスされる.例えば 

char *p ； 

p = (char *) 0x80; 

*p =10 ; 

で絶対メモリ番地 0 x 80 に10を入れることができる • p は， 0 x 80 に初期化された 
単なる文字ポインタである.ポインタはアドレスを保持しているのだから， p は 
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アドレス 0 x 80 をさし示している.キャスト [(cher * )0 x 80] は多くのコンパイ 
ラで必要である.このキャストは，コンパイラに数 0 x 80( int ) を文字ポインタの 
内容として取り扱うように教える . *p =10は10をアドレス 0 x 80 に入れる. 
p は char へのポインタであるから， char サイズ分のメモリ （1 バイト）だけが 
変更される . p が int ボインタであると宣言されていたら，2バイト変更される. 

この例は必要以上に複雑である. p は初期化されてからすぐに使用される.実 
際には，完全に p なしですますことができる.*卩=10の卩を （char * )0 x 80 
で置き換えると 

*( (char *)0x80 ) =10; 

になる.再び，これを可能にしたのはキャストである. 0 x 80 が文字ボインタの内 
容として扱うようコンパイラに教えている. 

メモリーマップド.ビデオ•ディスプレイのように，もっと複雑なデータ構造 

は，この方法でアクセスすることができる.例えば，68000上の80カラム X 25 

行のメモリーマップド•ディスプレイは2次元配列のようにみえる.そのディス 

プレイに対するベース•アドレスを 0 x 10000 とすれば，次の文字は番地 0 x 10001 

に，その次の文字は次の番地に，というように続く. 

# d e f 1 n e addr(row , co L) ((char * )0x10000 + (row * 80) + col) 

で，文字の位置を計算することができる.ここで，ディスプレイの左上の角は 

(0,0)である•式全体は，文字ポインタに評価される.また，次のように書くこ 

ともできるだろう. 

//define NUMR0WS 25 

#define NUMCOLS 80 

typedef char DI SPLAY[ NUMROWS ][ NUMCOLS ] 

#define SCREEN ( *((DISPLAY *)0x10000)) 

SCREEN [ 2 ] [ 3 ] = ' a'; 

ここで， 80 X 25 の文字配列に対する typedef をつくる. 0 x 10000 は，この型の 
配列へのボインタに型変換 ( cast ) される.それで ， （DISPLAY * )0 x 10000 は 
配列へのポインタである，もうひとつのアスタリスクを加えると配列自体（配列 
ポインタにさし示されるオブジェクト）になり，’ []’ をつけるとその配列の要 
素のひとつを参照することができる.コンパイラの中には，ポインタ演算がこん 
なに複雑になると混乱するものもある.こういうプログラムは有用ではあるが， 
必ずしも移植性はない. 


7.5 ハードウエアとやりとりするためのボインタの使用 
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SCREEN [ 0 ] [ 0 ] .attribute = NORMAL 

SCREEN [ 24 ] [ 0 ]. at tribute = UNDERLINED 

SCREEN [ 0 ][ 79 ] .attribute = REVERSE | BOLD 

SCREEN [ 24 ][ 79 ].attribute = NORMAL | BLINKING 


SCREEN [ 0 
SCREEN [ 2A 
SCREEN [ 0 
SCREEN [ 24 


7.5.2 C プログラムから IBM PC ビデオ•メモリへの直接アクセス 

8086ファミリ CPU では，直接メモリ•アドレッシングは簡単ではない.多く 
のコンパイラでは，8086のスモール•モデルで* ((char * )0 x 80) を使用しよう 
とすると，絶対アドレス0000 : 0080にあるセルではなく，現在のデータ•セグ 
メントからオフセット 0 x 80 にあるセルをアクセスするだろう.データ•セグメ 
ントの外にあるセルをアクセスするしかたは複雑である.さらに，この処理はコ 
ンパイラによってかなり異なる. 

しかし，数をポインタにキャストすれば可能である.再び，上の例を行って 
みよう.今度は，モノクローム.アダプタを備えた IBM PC のスクリーンに直 
接書く.このプログラムは ， Microsoft C Compiler (バージョン3以上）用で 
ある.図7.21に示すプログラムは，スクリーンの4すみに文字’1’，’2’，’3’，’4’ 
を書く.その1，2, 3, 4，はそれぞれ順にノーマル，アンダーライン，太字，ブ 
リンキング•モードで表示する. 


# d e f i n e 

NORMAL 

0x07 

/* 基本属性.これらのうちひとつだけ 

# d e f i n e 

UNDERLINED 

0x01 

/* が現れる. 

# d e f i n e 

REVERSE 

0x70 


//define 

BLINKING 

0x80 

/* 上の属性とお互いに OR される. 

# d e f i n e 

BOLD 

0x08 


typedef 

struct 




char letter; 

char attribute; 

> 

CHARACTER; 

typedef CHARACTER DISPLAY[25][80]; 

#def ine SCREEN ( *( (DISPLAY far *)0xb0000000 )) 
m a i n () 


12 3 4 

II II II II 


e e e e 

9 9 
0 0 7 7 


図 7 . 21 IBM PC のメモリーマップド•ディスプレイへの書込み 
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この問題を解くにあたっていくつか問題がある.第一に， IBM ディスプレイ上 
の文字は各2バイト必要である.下位バイトが文字で，上位バィトがその属性で 
ある.他に影響を与えずに，文字か属性を変更できるようにしたい.それで，2 
バイトのフィールド，第1のフィールドは文字 ( letter ) で第2フィールドは 
属性 （ attribute )， を含む構造体 CHARACTER の typedef をつくる. 8086は16 
ビット•ワードの下位バイトを下位のアドレスに格納するから， letter フィー 
ルドが構造体の中でさきに宣言されなければならない.次に， DISPLAY という 
2番目の typedef ， CHARACTER の 25 X 80 配列をつくる.最後に ， SCREEN 
の# define 文をつくる.ビデオ•メモリのベースアドレスを DISPLAY へのポ 
インタにキャストして，そのポインタを通して DISPLAY を参照できるようにも 
うひとつアスタリスクを加える.この最後の構文は，前の例で使用されている 
ものと同じである.配列へのボインタにさし示されているオブジェクトは配列自 
体であり，そして’ []’ の表記をまるで配列名につけるように，そのキャスト定 
数に適用することができる. 

ここで ， Microsoft Compiler の特異性が重要な役割をするようになる.予約 
語 far は，このコンパイラに特有のものである . far は，スモール.モデルのプロ 
グラム中に32ビットの far ポインタを生成するために使用される. far ポインタ 
は，現在のデータ•セグメント内のデータしかアクセスできない16ビットの near 
ポインタとは違って，メモリのどこの番地でも参照することができる . Microsoft 
のコンパイラは， far ポインタのセグメント•アドレスを上位16ビットのワード 
に，オフセットを下位16ビットのワードに格納する. IBM のビデオメモリは絶 
対アドレス OxbOOOO にある.セグメント•アドレスはパラグラフ•アドレスであ 
るので（つまり，絶対アドレスを求めるにはセグメント•アドレスに16をかけ 
なければならない）， OxbOOOO は8086にはセグメント：オフセットの形， B 000 : 
0000として表される. far ポインタを初期化するためには，8けた全部が必要で 
ある.それで 


(*( (DISPLAY far *)0xb0000000 )) 

としなければならない.構造体を参照するためにこの式を使っているから，もっ 
とも外側のかっこがここでは必要である. * がドット （•） より優先度が低いか 
ら，その式はこの外側のかっこがなければ正しく評価されない. 

この準備がすべて整ったら，スクリーンをアクセスするために SCREEN を使 


7.5 ハードウエアとやりとりするためのポインタの使用 
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用することができる . SCREEN [0] [0] は左上の角 ， SCREEN L 24 J [0] は左下 
の角 ， SCREEN [0] [79] は右上の角， SCREEN [24] [79] は右下の角である. 
その文字は 

SCREEN [row][col]. letter 
で参照される.その属性は次のようにして参照される. 

SCREEN[row][col].attribute 

モノクローム. アダプタにサポートされているさまざまな属性が NORMAL 
(通常 ）， UNDERLINED (下線 ）， REVERSE (反転）として : ft define されてい 
る.さらに，このうちのいくつかが必要に応じて BLINKING (点滅）か BOLD 
(太字）でビットごとの OR をされている（点滅し （ blinking )， 太字で （ bold ), 
下線付き （ underlined ) の文字等の 場合）. 残念なことに，下線付きの反転文字は 
できない(注 8). 

7. 5.3 モデル•ハードウェアに構造体を使用する 

メモリ•マップド I / O システムでは，隣り合ったブロックにあるレジスタ群が 
制御しているハードウェアは構造体でモデル化できる. SCSI ディスク•コント 
口ーラのメモリマップを図7.22に示す.このコントローラは図 7. 23に定義され 


デバイスの 

ベース•アドレスからの 
オフセット： 


0: 

1- 

1 

- | 

cmd レジスタ | 


1 : 

1 ■ 

1 

I 

未使用 

雜■麵禱禱■■■■画■睡垂 — 1 ■■函 ■— 圃■■■■画■麵■壽 1 


2: 

1 

1 

1 ■ 

-- |-| 

未使用 （ unused ) | 


4: 

1 

1 

I .. 

- 1 - 

変換する データへのボインタ 


8: 

1 

1 

1- 

SCSI コマンド•ブロックへのポインタ 



第1 バイト 丨 第2 バイト 丨 第3 バイト 丨第4 バイト | 

図7 . 22 SCSI ホスト.アダプタ 


注 8 : IBM デイスプレイについての詳しい情報は， Peter Norton の本にのっている . The Peter 
Norton Programmer’s Guide to the IBM PC ( bellevue , Wash . : Microsoft Press , 1985) 
pp . 67-97 • 
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ステム•メモリの * / 
スト . アダプタの */ 
ドレス */ 


HOST-ADAPTER; 
#define DISK 


： HOST.ADAPTER *)0x10000 ) /* 


c m d r e g ; 
unusedO ; 
unused 1; 
data.block; 
cmd_block : 


' ド • レジスタ 


データ•ブロックのアドレス 


/ -k C /^C T 




図7 .23 構造体として定義されたホスト.アダプタ 


ている構造体のように表すことができる. 

DISK に対する# define は最初の例にある (char *)0 x 80 と同じ機能を果た 
す.しかし，ここでは定数 0 x 10000 は HOST _ ADAPTER の構造体へのポイン 
夕の定数であるかのように扱われる.この定義を使うと 

D I SK->cmdreg = 0xa7; 

でホスト•アダプタの コマンド レジスタに 0 xa 7 を入れることができる. 一 〉演 
算子を使用しているから，前の例では必要だった*は必要ない. 一 > 演算子の 
左はポインタが必要である.データ•ポインタは 

char buffer[1024]; 

DATA->data_block = buffer; 

で初期化する. 

7.5.4 ハードウエア•インタフェースと移植性 

移ネ直性は， ハードウェアにイン タフ ェースす るすべての ルー チ ン にとって問題 
である.第一に，型の大きさが定義できない • int はどのくらいの大きさであるか， 
または int とボインタは同じ大きさなのかがわからない.図7,23では BYTE , 
WORD ， ADDRESS の# define はこの問題を最小にしている.移植性の少ない 
char , や long 等より，これらの# define が ハードウェアの 定義に使用される. 
コンパイラが かわったら， BYTE , WORD , ADDRESS の定義をやり直すこと 


typedef char 
typede f short 
typedef char 


B Y T E ; 

WORD ; 
★ADDRESS; 


/*16 ビッ 

/* 32 ビッ 


シホ T 


u E E D R R 

r T T R D D 

t Y Y o D D 

s B B w A A 

f 

e 

d 

e 

p 
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ができる.その他の定義はそれに応じて変更されるだろう. 

アライメントもまた問題であるかもしれない.このホスト-アダプタは68000 
CPU と使用される.16ビットか32ビットのメモリ•アクセスにはワード境界 
にアライメントをおく. 8ビットのオブジェクトは，偶数か奇数のアドレスでア 
クセスされる.このハードウェアは，アライメントに注意して設計されている. 
すべての複数バイトのオブジェクトは，偶数アドレスからおかれる.構造体には 
unusedO フイールドをおいて，アライメントをきちんと保っている.コンパイラ 
が構造体中のアライメントを保証するので，このフィールドは宣言する必要はな 
い（つまり，構造体でバイトの大きさのフイールドにワードの大きさのフイール 
ドが続くとき，臨時に1八イトそこに挿人されることを意味している.いいかえ 
れば，構造体内でフィールドの 連続 性は保証されない.構造体の大きさは 各 フィ 
ールドの大きさの合計よりも大きいこともある）.はっきりと unusedO を定義す 
ると 移植性が備わる. 68000のアライメント 制限を 持たない 計算機 （8088 のよう 
な）にプログラムを 移植す ることはできる. 

最後の問題：大きな数は計算機が違えば格納され方が違う.例えば，68000は 
2バイト int の MSB を下位メモリに格納するが，8086は下位メモリに LSB を 
格納する.したがって，ワードの大きさのレジスタを持つハードウェアを動かす 
ソフトウェアは，ハードウェアとソフトウェアを異なる CPU に移植するとき， 
問題があるかもしれない.ワード内の2つのバイトを交換する必要があるかもし 
れない.このバイトの交換は 

#define swapb(x) (((x) >> 8) & Oxff) | ((x) << 8) 

で行うことができるだろう. 

7. 6練 習 

7-1 次のプログラムが何をプリントするか説明しなさい. 

#include <stdio.h> 
m a i n () 

static int array[6][2]= 

て 

C ' ' , ' s ' >, <'d', ' r ' >, C'a • , *w'>, 

C'k', 'c'>, C'a*, 'b*>, { • c', *d'> 


>； 


*(*p+3); 

*(*(pp-1)+2); 

I 「 I • 

* * p + 5 ; 


7-4 次の宣言を書きなさい. 

( a ) int の配列へのボインタの配列へのポインタ 

(b ) int へのポインタをかえす関数へのポインタをかえす関数へのポイ 
ンタの配列 

(c ) float の配列へのボインタの配列をかえす関数. 

(d ) 各々が char へのポインタをかえす複数の関数へのポインタの配歹 IJ 
へのポインタをかえす関数 
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int *p = (int * ) (ar ray + 4 ); 

f o r( + + p; p >= (int * ) a r r ay ; putchar( *p--)) 

f 

> 

7-2 次のプログラムが何をプリントするのか？ array は何かことばで説明し 
なさい.それを図示しなさい. printf () への引数全部がどうなるのか， 
そしてなぜそれらが行うものに評価されるのか説明しなさい. 


ma 1 n ( 


static char 


♦array[2][3] 


" c", "ng " 
_ u s i , "fun" 


"no" >, 
"onf" > 


>； 


printf("%s%s%s%s\n", **ar ray, *(*(array + 1 )+2 ), 

♦array [1] # array [0][1] ); 

> 

7-3 次のプログラムが何をプリントするのか？ 各行で起こることを説明しな 
さい.必要なら図を書きなさい. 


m a 1 n ( 
i 


static char 
static char 

* * + + pp - = 

printf("%s 


fr p [] 
t*pp 


•moLdy\n" , '»j e l l o" > ; 


"PP 


4 

+ 3 

o1 I 
[ - 
p[ 

(p + + 
* p + * 


2 


p p 
★ p 
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( e ) double の10要素の配列（へのポインタ）をかえす複数の関数への 
ポインタの配列へのポインタをかえす関数 
7-5 沉用の2分探索ルーチン： 

bsearch( Key, array, nel , width, cmp ) 

を書きなさい.ここで， key は探索することば key へのポインタ ， array 
はその配列の最初の要素へのポインタ， nel は配列の要素の数， cmp は比 
較関数へのポインタである.比較関数は発見したオブジェクトか， key に 
対応するものが配列内になかったときは NULL をかえす. 

7-6 行列は，エンジニアリング•アプリケーションやグラフィックス•アプリ 
ケーションで方程式を表すために，簡単形としてよく使用される数の長方 
形の配列である.それらはコンピュータでは2次元配列として表される. 

2つの行列は一方の列の数と，他方の行の数が同じならばかけ合わせるこ 
とができる.行列のかけ算の結果もやはり行列である.その行列は，最初 
の行列と同じ列の数を持ち，2番目の行列と同じ行の数を持つ.この処理 
が次の例に表されている. 

"4' 

[123] X 5 
6 . 

は， 

[( lX 4) + (2 X 5) + (3+6)] = [4 + 10 + 18] = [32] 

と評価される.つまり，その積は 1 X 1 の行列である. 

'1 31 「5 7 91 

X 

1_2 4」 |_6 810」 

の積は3列，2行である.それは次に示されている. 

•((1 X 5) + (3 X 6)) ((1 X 7)+(3 X 8)) ((1 X 9)+ (3 X 10))' 
.((2 X 5)+(5 X 6)) ((2 X 7)+(4 X 8)) ((2 X 9)+(4 X 10)). 

次のサブルーチンを書きなさい. 

matrix_mult( prod , a, b, a_row, a_col, b_row, b_co L ) 

char *p r od # * a, *b; 

int a_row, a_co l , b_row, b_col; 

a と b は int の 2 次元配列として表される 2 つの行列の最初のセルへのポイ 

ンタである. prod は， a と b の積がおかれるメモリ領域へのポインタであ 
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る. a — row と a _ col は，行列 a の行の数と列の数である. b _ row と b_col 
は，行列 b の行の数と列の数である.配列の宣言以外では’ []’ 表記を使 
わないで，表記* (p + i ) を使用する.すべての配列要素のアクセスはポ 
インタを使用し，ポインタを直接操作することでポインタを更新する. 



8 再帰とコンパイラ•デザイン 


再帰 （ recursion ) サブルーチンは，自分自身を呼びだすサブルーチンである. 
多くのプログラミングの本で再帰について述べているけれども，通常は，なぜ再 
帰サブルーチンのテクニックを誰もが使うのか，理解しにくい単純な例を与えて 
いるだけである.再帰は，簡単な動作をより理解しにく くする方法であると思わ 
れている.例えば，階乗を計算する場合に，階乗の計算結果をみつけるために再 
帰を使用することは馬鹿げているだけでなく，メモリを必要もなくむだにしてい 
る.しかし，再帰を使ったプログラムの中には，重要なコンパイラや2分木の操 
作など本当に役立つものもある.このタイプの問題の再帰的解決は，かなりプロ 
グラムの量を減らし，同じことを繰りかえし書くよりも理解しやすい.本章では， 
再帰の妥当な使い方（コンハ。イラの設計）を調べる.実際のコンピュータ言語の認 
識から小さな計算式の解析までの問題を減少させることはあきらかな利点である. 
一方に使われたテクニックは，もう一方に応用可能である.ここでとりあげる式 
解析プログラムは，計算式を表す ASCCI 文字列を入力とする.数，かっこ，演 
算子+，_，/， * だけが使用できる.解析プログラムはその評価の結果をかえ 
す.例えば，文字列 “（3+1)*2” をこの解析プログラムに与えると，8がかえさ 
れる.このルーチンはちょっと馬鹿げているが，ポイントは複雑な式を解析する 
ことではなく，コンパイラを理解することである.コンハ。イラを調べながら，プロ 
グラミング言語を記述する標準表記：バッカス記法 (Backus Naur Form , BNF ) 
も考察する.この表記法は， C コンパイラに使用される構文を説明するのによく 
使われる. BNF を理解すると C 言語の数冊のよりよい参考書を解読するのにか 
なり役立つだろう. 


200 


8. 再帰とコンパイラ.デザイン 


8.1 再帰はどのように動くか 

コンパイラの設計自体に入る前に，実際に再帰がどのように動くのか説明す 
るのが適切であろう.説明するために，さきほどけなした階乗の例を使ってみる 
(これはとても短いから）.階乗関数は次の式を計算する. 

N * (N-1 )* (N-2) * (N-3) ...*3*2*1 

例えば，5の階乗（通常簡略形で 5!) は， 

5*4*3*2*1=120 

である.この式は面白い利点がある. N の階乗は N *( N -1階乗）と等しい•具体 
的な例で調べてみると，式 


または 

5! == 5 * (4 * 3 * 2 * 1) 

と書き直すことができる.階乗はそれ自体を計算して定義することができる（つ 
まり，階乗の定義は階乗の展開を含むことができる）.それは，問題の再帰的解決 
を示す，自己参照的な定義のようなものである.しかし，この処理を止める方法 
を欠いている.特別な場合として0!を定義して処理を止める. 

( 1 ) 0! (0 の階乗）と1!はどちらも1に等しい. 

(2) それ以外の数に対しては N ! = N *( N -1)! 

この規則を使うと次の C サブルーチンをつくることができる.それは N ! をか 
えす. 


factorial ( N 
N ； 

if ( N 

else 



return 

return 


/* 0 != 


N * factorial (N-1) 


このサブルーチンがどのように動くか理解するためには，サブルーチンが呼びだ 
されたとき，スタック上に何が起こるか知っておく必要がある（スタック•フレー 
ムが何で， それがどのようにつくられるかよくわからなかったら4章を読み直す 



8.1 再帰はどのように動くか 
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FP — 

まえの FP 


FP +2 

リターン.アドレス 

因数のスタック.フレーム 

FP +4 N : 

3 




呼出しをしたサブルーチンの 
スタック • フレーム 


図8 . 1 factorial (3) の実行時にできるスタック•フレーム 


必要がある）.サブルーチン factorial () が3つの引数とともに呼びだされると 
き，図 8.1 に示されるスタック•フレームがつくられる. 

ローカル変数はない.それで，スタック•フレームの中には， factorial () に渡 
されたパラメータ N ， リターン•アドレス，前のフレーム.ポインタの3つだ 
けがある.変数 N は，いつもフレーム•ポインタからのオフセットを使用して 
factorial () からアクセスされる.つまり， N はフレーム•ポインタからオフセッ 
卜+4 (4 FP ) のところにある.この N は固定メモリアドレスにはない.スタッ 
ク上にあり，いつもフレーム•ポインタの現在の値からのオフセットを通してア 
クセスされる. 

factorial () の中で何が行われるか？ 最初に， N く =1が調べられる.それは， 
N の値を得るためにフレーム•ポインタからオフセット4にあるメモリ • セルの内 
容を取り出す.条件に合わなければ， else 節が実行される.しかし，そこで計算が 
行われる前に，サブルーチン factorial が（再帰的に）呼びだされる. factorial () 
が自分を呼びだしているという事実は，コンパイラの立場からはたいしたことで 


FP -> 



前の FP 

2回目の呼出しのスタック- 

フレーム 


リターン•アドレス 

N : 

2 



前の FP 

最初の呼出しのスタック•フ 
レーム（この N は最初の呼出 


リターン.アドレス 

N : 

3 

しに属する） 



呼出しをしたサブル_チンの 
スタック*フレ_ム 


図 8 • 2 再帰呼出し後の スタック 
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はない.他のサブルーチンを呼びだすように再帰呼出しをするだけである.スタッ 
クに N の値をプッシュして，それから factorial () の最初の行に制御を移す•こ 
こで， 再帰的に起動された factoriaK ) に渡された値は N ではなく N -1である. 
factoriaK ) が最初に行うのは，図 8.2 に示すように，新しいスタック•フレーム 
の設定である. 

今，スタック上には2つの N がある.ひとつは最初の呼出しのスタック•フレー 
ムにあり， 2 つ目は再帰呼出しのスタック•フレームにある.しかし， factoriaK ) 
の中で N として使われる値は，計算機が新しい方のフレーム•ボインタからの才 
フセット4のところに発見するものであるから，2つ目のスタック•フレームに 
ある N が 2 番目の factoriaK ) の呼出しでは使用される.重大なエラーを除いて 
は，サブルーチンが，他のサブルーチンのスタック.フレームにある変数をアク 
セスすることはない.それで， factoriaK ) の再帰呼出しは，もとの factoriaK ) 
のスタック.フレームにある N を変更することはできない. 

もう一度繰りかえすために再帰的な処理が同じ方法で続く•今，3つのスタッ 
ク•フレームが存在する.この時点のスタックを図 8.3 に示す.使用される N の 
値は，もっとも新しくつくられたスタック.フレームにある. 

この時点で，それぞれのスタック•フレームに関係する N の中に，連続する 
factoriaK ) のすべての要素（3,2, 1) がスタック上にある.それで後はこれらの N 
をかけ合わせればよい.サブルーチンは条件 N く =1を行う. N がフレーム•ポ 


前の FP 

3回目の呼出しのスタック. 

フレーム（この N は今使用さ 
れている） 

リターン•アドレス 

1 

前の FP 

2回目の呼出しのスタック. 

フレーム 

リターン•アドレス 

2 

前の FP 

最初の呼出しのスタック.フ 
レーム 

リターン•アドレス 

3 


呼出しをしたサブルーチンの 
スタック*フレーム 


図8 • 3スタックの最後の状態 
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インタのオフセット4にあるセルから取りだされる.このアドレスにあるセルは 
1を保持している.それで条件は満たされ，1が呼出しをしたサブルーチンにか 
えされる.もっとも新しくつくられたスタック•フレームが削除され，図 8.2 の 
状態にスタックはもどる.しかし，スタック•フレームが削除される前に，返り 
値 （1) はレジスタにコピーされる. 

ひとつ前の factorial () の呼出しにもどる.次の行を実行している. 
return( N * factorial (N-1) ) ; 

今，呼出しから factorial () にかえってきたところである.その呼出しは値1をか 
之した. その1 ( レジスタ中にある）に N (スタックにある）をかける. N のこの 
コピーは2を保持しているから， 2*1 すなわち2を呼出したサブルーチンにかえ 
す.現在のスタック.フレームを削除される. factorial () の呼出しからもどると 
き，1を渡すのに使われたものと同じレジスタに返り値 （2) をコピーする. 

factorial ( N -1)からかえってきたこの時点で， factorial () への最初の呼出しに 
もどる.返り値をかえすために使われたレジスタは2を含んでいる.スタックは 
図 8.7 に示されている状態にもどる.その呼出しからかえされた2に N (フレー 
ム•ポインタからオフセット4にある）をかけ，結果は3*2，すなわち6になる. 
この6は最初の呼出しをしたルーチンにかえされる.全体の過程を図8_4に図示 
している. 


呼出しをしたルーチン 
n =3 | | リターン6 

factorial (3) 

n =2 | | リターン 2 

factorial (2) 

n = l | | りターン 1 
factorial ( l ) 

図 8-4 factorial (3) 呼出しのサブルーチン • トレース 


factorial () はたくさんのスタックを使う.実際，6バイトのスタック.フレー 
ムで ， factorial (170) は 1 K スタックをオーバーするスタックをつくる（使用でき 
るスタックより多く必要とする）.これは再帰サブルーチンに起こる一般的な問題 
である.たえずスタックがどんな状態になりつつあるかを考慮し，スタックが大 
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# include <stdio.h> 
#define TOO-DEEP 18 


L ong 
l ong 


factorial( N ) 
N; 


static int recursion-level = 0; 

/* 安全な factorial ルーチン.ルーチンが再帰的レベル 
* TOO _ DEEP を越えると N !か0をかえす 


1 f ( N 
else 



/* 0 !== 1!==1 */ 


1 f( + + recursion_level >= TOO-DEEP ) 
N = 0 ; 


else 


N = N ★ factorial( N-1 ); 


--recursion-level; 

> 

return N ; 


図 8 • 5 安全な factorial ルーチン 


きくなり過ぎそうならばプログラムで避けるようにしなければならない.スタッ 
クの深さを監視する factorial () の改良版が図 8.5 に示されている.その改良さ 
れたサブルーチンは，再帰レベルの数が TOO _ DEEP を越えそうならば0をかえ 
す（〇!== 1 だから通常は〇はかえされない）. recursion _ level は static で宣言され 
ているから，次の再帰レベルで使えるようにその値を得ることができるだろう. 
static 変数はスタックにはなく，固定アドレスにある. 

ここで，スタック•オーバーフローを実際上問題なく行う，別の方法がある. 
factoriaK ) の連続はまったくはやく成長する.実際， 12!が 符号付き 32 ビット long 
int で表せるもっとも大きな値である （12! ==479001600,13! ==6227020800, 
0 x 7 fffffff = =2 147 483 647) . したがって ， factoriaK ) の先頭で N > 12 
か調べ，もしそうならば 0 をかえすべきである.再帰 レベル12 は 96 バイトのス 
タックしか使わない.それで， N に制限を設ければスタック.オーバ_フローを 
心配する必要はない[スタック•フ レームは N が 4 バイトの long , 2 バイトのリ 
ターン •アドレス，2 バイトの前フ レーム. ポインタを想定している （ recursion — 
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level は static だからスタックを使わない）.実際の大きさはコンパイラによって 
異なる〕. 

8.2 コンパイラの構造 

実用的な，とても小さなコンパイラに応用してみよう.どのコンパイラも3つ 
の機能的に異なる部分を持っている.これらの部分はしばしば組み合わされてい 
るが，独立した機能として調べることがもっともよい.コンパイラの最初の部分 
は卜ークン認識プログラム (token recognizer ) である.卜ークンとは，入力文字 
列からの ASCII 文字をグループ分けしたとき，コンパイラにとって意味のある文 
字の集合である.つまり，プログラムはトークンの集合としてみることができる. 
各トークンはひとつ以上連続した ASCII 文字である.例えば， C 言語では ASCII 
文字；はトークンである.同様に予約語 while もトークンである.そして，+， 

+ +，+ =などの，演算子のトークンのために複雑になる.トークンはプロダラ 
ミンダの原子のようなもので，分けることができない （wh ile とはいえない）. 
トークンはいつも内部的には計算上の型か，あるいはファイルのへッダのどこか 
にある井 define に対応する整数値の集まりとして表される.トークン認識プログ 
ラムは，入力列からトークンに対応する整数をかえすサブルーチンである.この 
例ではトークン認識プログラムは使わない.むしろ，入力を解釈しながら，入力 
文字列を実際に調べることによって，トークンを認識する. 

コンパイラの2番目の部分は，構文解析プログラム ( parser ) である.これが作 
業の多くを行う.単語 parse は言語学からきたことばで，言語学でもコンピュー 
夕•サイエンスでも同じ意味を持つ.“（文章を）構成部分に分解し，文法的に記 
述すること（注1)”である.ただ，文章というところをプログラムに置き換えれ 
ばよい.コンピュータ言語は，正式な文法で記述される（後で，文法について調 
ベる）.構文解析プログラムはプログラムを構成部分に分解し，文法的な文脈に 
そって解釈する.すなわち，構文解析プログラムは，トークン認識プログラムか 
らかえされたトークンをコンパイラがコード生成をするのに都合のよい方法に構 
成する. 

処理過程は，構文解析ツリー (parse tree ) をつくることができる.例えば， 

注 1 : The Compact Edition of the Oxford English Dictionary (Oxford : Oxford University Press , 
1971) p .2083. 
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ホ 



A B C D 
図8 . 6 (A + B)*(C + D ) の構文要素ツリー 


式 （ a — b ) * ( c — d ) は，図 8.6 に示されるツリーに構成することができる. 

コンパイラの3番目の部分，コード生成プログラム (code generator ) は構文解 
析ッリーをある順序で読んで，規則にしたがって命令コードを生成する.例えば， 
図 8.6 に示すツリーの演算子の後置読みをする（まず，左のノード，中央のノー 
ド，右のノード，そしてルートへと繰りかえし進む）.トークンは次の順になって 
いる. 

(ab+)(cd + ) * 

ここで，上の式は，トークンを取りあげながら，ツリーの各トークンに次の規 
則を適用して計算する. 

( 1 ) トークンがかっこなら，何もしない. 

(2) トークンが変数 （ a ， b ， c ， d ) なら，その変数をスタックにプッシュする. 

(3) トークンが記号+ならば，スタックから項を2つポップし，それらをたし 
て結果をプッシュする. 

( 4 ) トークンがアスタリスクならば，スタックから項を2つポップしてそれら 
をかけ合わせ，結果をスタックにプッシュする. 

構文解析 （ツリーの 解析） が終わったとき，その答えはスタックの 一番 上にあ 
る.ヒューレット•パッカードの計算機の持ち主は，この処理をよく知っている 
だろう. 

現実のコンピュータでは，適用される実際のルールは，トークンの型と構文解 
析ツリーでの卜ークンの位置が互いに関係し作用する.また，多くのコンパイラ 
(ここで開発しようとしている式 解析 プログラムを含んでいる）は， 構造体 やボイ 
ンタなどで構成するツリーを実際は生成しない.むしろ，構文解析ツリーの構造 













8.3 文法：コンピュータ言語を表現する 
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は，構文解析プログラムのサブルーチン呼出しシーケンスや，構文解析処理中の 
プログラムの内部状態に隠されている. 

構文解析プログラムには，いくつか選択がある.多くのコンパイラは，表を使っ 
た構文解析プログラムを使用している.これは，コンパイラーコンパイラで自動的 
につくることができる UNIX ユーティリティの YACC (Yet Another Compiler 
Compiler ) は，そんなプログラムの1例である.プログラミング言語の語形記述 
を与えれば， YACC は汎用の表をもとにした構文解析プログラムが使用できる表 
をつくる. 

多くの公有のコンパイラ （ SmallC など）はあまり洗練された方法は使っていな 
い. これらのコンパイラは，再帰的下向き （recursive descent ) 構文解析として知 
られる構文解析の方法を使っている.再帰的下向き構文解析は，表をもとにした 
ものより理解しやすい.実行もはやく，よりよいエラ ー•メッセ_ジをだす.一 
方，それは手で組み立てなければならない.再帰的下向きコンパイラの動作方法 
をかえるには，コンパイラ自体をかえなければならない.表をもとにしたコンパイ 
ラを変更するには，表だけをかえればよい.維持管理が，再帰的下向きコンパイ 
ラでは問題になる. 

8.3 文法：コンピュータ言語を表現する 

プログラムを書き始めるもっともよい方法は，記号形式のようなものに対する 
問題を減らすことである.アウトライン，流れ図， Warnier - Orr 図が主な記号削 
減の例である•コンパイラもこの処理の例外ではない.コンパイラを書くときは， 
文法 （ grammar ) という形式的な記号書式で，コンパイルされるプログラミング 
言語を表すことから始める.どのプログラミング言語も，いくつかの文法で記述 
することができる.読者が使おうとしている構文解析プログラムのタイプが，ど 
の文法が読者のアプリケーションに適しているかを決定する.文法を記述するた 
めに使用するもっとも有効な表記はパ'ッカス記法 (Backus Naur Form , 略して 
BNF ) である、 

式解析プログラムをつくるためには，文法定義から始めなければならない.最 
初の疑問は，式は正確には何であるか？ ということである.高校時代に，式は 
因数の組み合わさったものだとおぼえただろう.因数自体（ひとつの数）が式で 
ある.演算子で分離された2つの因数も式である.次式は，この規則を BNF で 
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表したものである. 


〈式〉：：=く因子〉 

く式〉：：=〈因子〉く演算子〉〈因子〉 

記号：：=は“として定義する”という意味である.：：=の左の単語はその 
定義の名前，：：=の右は定義本体である.最初の行は，〈式〉が〈因子〉として 
定義されていると解釈する.行全体は プロダクション （ production ) と呼ばれる. 
プロダクション 中では論理〇 R を表すために従 棒 （ I ) を使用する. 

〈式〉：：=く因子〉 

I 〈因子〉〈演算子〉く因子〉 

〈式〉の BNF 定義の要素は入カストリームにみられる実際の記号ではない記号 
があることに気づくだろう.つまり，〈因子〉とぐ演算子〉は実際のプログラムと 
関係する前に，さらに詳しく定義されていなければならない.〈因子〉のように， 
さらに定義が必要な記号は非終端記号と呼ばれる.入力にみられる記号は終端記 
号と呼ばれる.本章では，非終端記号は’く〉’で囲まれ，終端記号は囲まれてい 
ない.演算子になる4つの終端記号は+， 一 ，/， * である.演算子の BNF 規 
則は 

く演算子〉：：=+丨一丨 * I / 


である. 

因子を定義するのはちょっと難しい.因子はひとつの数であるが，別の式であっ 
てもよい （a + b — d で， a はひとつ目の因子， b — d は2つ目の因子）.因子の BNF 
定義は 

〈因子〉：：=く数> 丨く式〉 

である.まだ定義されていないのは，〈数〉である.〈数〉は，トークン認識プログ 


1 ) 〈式〉 • . = く因子〉 

I 〈因子〉く演算子〉〈因子〉 

2) 〈演算子〉：：= +1-1*1/ 

3) 〈因子〉：：=〈数> 丨〈式〉 

4) 〈数〉 ：：=集合 { 012 3 4 5 6 7 3 9 } 

にある ASCII 文字の文字列 


図 8.7 簡単な式認識の文法 







8.4 文法を用いた構文解析 
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ラムが発見しやすいので，少しごまかして，ことばで簡単に定義する.ここで使 
う文法全体を図 8*7 に示す. 

::=の右にあるどの非終端記号も左側で定義されている.そして，：：=の 
左に終端記号はない.例1+2でこの文法を検査してみよう.1と2はどちらも 
〈数〉である.だから規則4を使って，1と2を同等の非終端記号で置き換えるこ 
とができる： 


1+2 

〈数〉+〈数〉 

規則3によると，ひとつの数は因子でもある.だからまた置き換えを行う： 

く数〉+〈数〉 

く因子〉+ く因子〉 


+は規則2を使って評価する： 


く因子〉+ く因子〉 

く因子〉く演算子〉〈因子〉 

最後に，規則1を使って，上記をひとつの〈式〉で置き換える： 


く因子〉く演算子〉く因子〉 

〈式〉 

入力のトークン1+ 2を文法の規則を使ってひとつの〈式〉に減らした.だから， 
1+ 2はこの文法にかなった式であるという結論になる. 

式にエラーがあったらどうなのか？1+*を構文解析してみよう.規則2と 
4を適用すると 

く数〉〈演算子〉〈演算子〉 

になり，さらに規則3を適用すると 

〈因子〉く演算子〉〈演算子〉 

になる.しかし，これ以上数を減らすために適用できる規則はない.したがって 
1—* はここでの文法で定義される式ではないという結論になる. 

8.4 文法を用いた構文解析 

構文解析プログラムは，入カトークンの集合をひとつの非終端記号に減らすプ 
ログラムとしてみることができる.式1+ 2の例からわかるだろう.構文解析プロ 
グラムを本当のコンパイラにかえるには，コード生成をする他，何か動作をさせ 
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く式〉 

く式〉 

く演算子〉 
く因子〉 

く因子〉 
〈数〉 


〈因子〉 

く因子〉く演算子〉く因子〉 

+ 1 - 1 * 1 / 

〈数〉 

く式〉 

’0,から’9’ までの範囲にある ASCII 文 
字の文字列 


何もしない 

スタックから2つのオブジヱクトをポップし，演算子を適 
用する（規則3にある）.それから結果をプッシュする. 
規則2の演算子をおぼえておく 
数をスタックにプッシュする 
何もしない 

ASCII 文字列を数に変換する 

囡8 • 8文法に動作規則の付加 


ることが必要である.それで，動作規則 (action rule ) を各文法と関連づける. 
動作規則も加わり少し雑然としているが，ここでの文法を図 8*8 に示す. 

文法規則を適用するたびに，等価な動作規則で規定されている動作も行う.1+ 2 
が，図 8.8 の文法で構文解析され，図 8.9 に示されている.もう少し複雑な例を 
図 8*10 に示す. 

たぶん，読者は処理をどのように行うかわかり始めているだろう.動作規則が 
実際に演算を行うよりも，演算を行うために必要な命令コードを生成することが 
わかったら， コンパイラ を理解していることになる. 

残念ながら，今定義した文法はあまり役にたたない.少なくとも，かっこと負 
数の処理部分を持たせたい.式全体を負に[例えば，一（17*11)〕したい.図 8*9 
と8.10では，式が左から右に構文解析されながら，可能な置換がすべて行われて 
いることに気がつくだろう.もっと現実的な文法はいくぶん複雑な方法で置き換 


+ 

+ 


規則：動作： 

2 一 もとの人力文字列 


く 数〉 + 2 6 

く因子〉 + 2 4 

〈因子〉く演算子〉 2 3 

〈因子〉く演算子〉〈数〉 6 

く因子〉く演算子〉〈因子〉 4 
く式〉 2 


ASCII “1”を int に変換する. 

1をプッシュする（前のステップの結果） 

+をおぼえておく 

ASCII “2” を int に変換する. 

2をプッシュする 

1と2をポップし，十を行い，結果をプッシュする. 


[H 8 • 9図 8. 8の文法を使用しながら1+ 2を式解析する 


\)/ \)/ \)/ \—/ \—/ \)/ HM* \ X, \ / 

123456 10 12 

• /|\ /(\ /1\ /(\ /V /-- /—V /|\ 

法 作 

文 動 


3 4 5 6 
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〈式〉 ：：= く因子〉 

I 〈因子〉*く式〉 

I 〈因子〉/く式〉 

I 〈因子〉十く式〉 

I く因子〉-く式〉 

〈因子〉：：= (〈式〉） 

I -( く式〉） 

I 〈定数〉 

I 一〈定数〉 

〈定数〉：：= ，〇’ から’9’ の範囲の ASCII 文字列 

図8 • 11より現実的な式認識文法 


えをする.そして，文法はその複雑さを考慮しなければならない.さらに，文法 
は，構文解析プログラムが常に現在の入力記号と処理される規則に基づいて，ど 
の規則を適用するのかわかるように構成されていなければならない.よりよい式 
認識の文法を図8.11に示す.実際のプログラムでこの文法を使ってみょう. 

8.5 再帰的下向き構文解析プログラム 

構文解析プログラムがどのように動いているかみるためにもっともよい方法は， 
それを調べてみることである.図8.11にある文法用の完全な構文解析プログラム 
を図8_12に示す. 

構文解析プログラムの適切な討議をする前に，そのプログラムがどの J •うに 


規則 

1+2-3 - 

く数 >+2-3 6 

〈因子 > + 2—3 4 

〈因子〉く演算子〉 2-3 3 

〈因子〉〈演算子〉く数〉一3 6 

く因子〉〈演算子〉〈因子>—3 4 

く 式〉-3 2 

〈因子 > — 3 1 

〈因子〉く演算子> 3 3 

〈因子〉〈演算子〉〈数〉 6 

〈因子〉〈演算子〉く因子〉 4 

く式〉 2 


動作： 

ここから始まる 
“1”を int に変換する. 

1をブッシュする 
+をおぼえておく 
“2” を int に変換する. 

2をプッシュする 
2つの数をポップし，+を行レ 
をプッシュする. 

何もしない 
—をおぼえておく 
“3” を int に変換する. 

3をプッシュする 

2つの数をスタックからポップし，ひ 
き算を行う，結果をプッシュする. 


結果 


図8 • 101十2—3の式解析 


\ / \1/ \)/ \ / \—/ V)/ \n/ \—/ \—/ \)/ 

12345 6789 10 

/{\ /IV /V /(\ /(\ /IV /V /__ /f\ /_\ 
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//include <std i 〇 . h> 
/* EXPR.C: A small 


arithmetic expression analyzer 


6 : 

7 

8 
9 

10 
11 
12 

13 

14 

15 

16 

17 

18 

19 

20 
21 
22 

23 

24 

25 

26 

27 

28 

29 

30 

31 

32 

33 

34 

35 

36 

37 

38 

39 

40 

41 

42 

43 

44 

45 

46 

47 

48 

49 
5 

5 

5 

5 

5 

5 

5 

5 

5 

5 

6 

61 

62: 

63: 

64: 

65: 

66 : 

67: 

68 : 


i て:、 巧を漂了 ㈣ !:ご一 

文字集合 { 0123456789 + —* パ）/}で形成されなければならない.ェ白はんめよい. 


く式〉 


〈因子〉 


〈定数〉 


く因子〉 

|〈因子〉*〈式〉 

I く因子〉/く式〉 

I 〈因子〉+〈式〉 

I 〈因子〉一〈式〉 

(く 式〉） 

I 一（〈式〉) 

I 〈定数〉 

I 一く定数〉 

，0’ から’9’ の範囲の ASCII 文字列 


グロー バル変数： 


static 

static 


*Str ; 
Error; 


/* 構文解析する文字列中の現在の位置 . * ! 
/* 発見され たエラーの 番号 *! 


fdef DEBUG 
main(argc, argv) 


char 


a r g v ; 


式解析プロ グラムの 練習をするためのルーチン：式がコマンド上に与えられた 

矣，が口，25はらぽ冗はす I •を—から“行にっきひとっ) 

孕⑼エ溫 i •ラ-がぁったらシェルに -1 をかぇす.インタラクティブ. 
モードでエラー があったら，0をかえす. 

エラーがなかったら計算結果をかえす • 


char buf[133] , *bp = but ; 
int err, r v a l ; 

if( argc > 2 ) 

fp 「 intf(stderr, "Usage: expr [<expression>]") 


argc > 


rval = parse( argv[1],&err 〉； 
printf(err ? "*** ERROR ***" : "%d", rval 

ex i t( rval ); 


printfCEnter expression or <CR> to exi 
while(1) 

printfC'? 


program\n"); 


(図8.12つづく） 
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113 
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static int expr() 
i 

int lva L; 

L va L = f ac tor(); 

switch (*S t r ) 

{ 

case ' + ': S t r + + 
case '- 1 : S t r + + 
case '*': S t r + + 
case 1 / 1 ： S t r + + 
default : 


return( lva l ); 


static int f ac tor( 


s i gn 


sign = 
Str++; 


r v al = constant( 


(図8.12つづく ) 


if( gets(buf ) == NULL | | 
e x i t ( 0 ); 


r va L = par se(buf , &e 
if( err ) 
else 


printfC'*** ERROR ***\n"); 
printf("%s = %d\n", buf, rval); 


#endif 


char 

int 


parse( expresslon, 
♦expression; 


/* expression (式）の値か，または文字列にエラーがあったときは0をかえす. 

* * Err はエラーの数にセットされる. parse は expr () に対するアクセス.ルー 

* チンである.アクセス•ルーチンを使用すると， expr () が使うグローバル変 
* 数については知る必要がない. 


reg 1 s ter int r va 

Error = 0; 

Str = expression; 
r val = expr(); 
return( (*er r = Err 


k k k k •, 
aaaa k 
eeeea 


r r r r 
p p p p 
X X X X 

e e e e 

ii ii ii ii 
+ i * / 

aaaa 
V V V V 











214 


138: 

139: 

140 : 

141: 

142: 

143: 

144: 

145 : 

146: 

147: 

148: 

U9: 

150: 

151:> 

152 : 

153: /* 

15A : 

155: static int constant() 

156: { 

157: int rval = 0 ; 

158: 

159: if( !isdig i t( *Str )) 

160: E r r or + + ; 

161 : 

162 : while ( *Str && isd i g i t(*Str)) 

163: i 

164: rval = (rval * 10) + (*Str - ' 0 1 )； 

165: Str++; 

166: > 

167: 

168: return( rval ); 

169: > 


8. 再帰とコンパイラ.デザイ 


S t r + +; 

rval = expr( 


else 


printf("Missing close parenthesis\n"); 
E r ror + + ; 


eturn (rval * sign); 


図 8 •12 簡単な式の解析プログラム 


構成されているかを述べる.構文解析プログラム中の実際のサブルーチンは何度 
も繰りかえされる.だから，それらが動作するときにはたくさんのスタックを使 
用する（これは再帰的サブルーチンには一般的な問題である.再帰的サブルーチ 
ンはかなりたくさんのスタックのメモリを使用する）.このスタックの使用量のた 
め，サブルーチンにはできるだけ少ないパラメータを渡すようにしたい（このパ 
ラメータがスタックを消費するから）.引数としてサブルーチンに渡される変数 
をグローバルにすることで，使用するスタックの量を減らすことができる.しか 
し，これを実際に行うと新しい問題を生みだす. C では，非静的な全グローバル 
変数はプログラム内の全モジュールに共有される.式解析プログラムはたぶんラ 
イブラリ.ルーチンであるだろうし，それにプログラムの残りの通常動作を邪魔 
してほしくない.さらに，プログラマがグローバル変数ごとに，特定のル—チン 
で使用されていて，他のところでは使用できないことをおぼえていなければいけな 
いようにはしたくない.この問題は，グローバル変数を static で宣言することで 
解決する.式解析ルーチン内部で使用するだけのサブルーチンも static にする. 
ここで，構文解析モジュールの外から静的グローバル変数を初期化する方法が必 
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要になる.プログラム.リストの84行目から始まるアクセス.ルーチン（外部から 
だけアクセスできるモジュール内のサブルーチン）で初期化を行う. この parse () 
というアクセス•ルーチンは，初期化しか行わない.実際の解析作業をするため 
に expr () を呼びだす. 

その他の構成上大事なものは，34〜79行の main () ルーチンである. main () 
の第1の目的は parse () を検査すること一32〜81行の# ifdef /# endif —である. 
ライブラリに組み込むためにコンハ。イルするときには， DEBUG は # define しな 
い. main () ルーチンはそれだけで適度に役に たつ. コマンド行 [ exprl 7 バ 2* 12)] 
から式を入力することができる.または， expr とタイプし，簡単な卓上計算機の 
ように， プログラムがプロンプト を出したときに式を入力することもできる. 

構文 解析 プログラムにもどって， 図 8.11の プログラムでみておくことが2, 3 
ある.第一に，：：=に続くもっとも左の記号は，終端記号かまたは， すべての 
規則に対して同じ非終端記号である.つまり，〈式〉 （expr) に関係する規則は すべ 
て，もっとも左の記号として〈因子〉 ( factor ) を持つ.全〈因子〉のもっとも左の 
記号は終端記号〔（ゃ一]か非終端記号〈定数〉 （ constant ) である.定数のもっとも 
左の記号は ASCII 数字でなければならない.文法のこの特性は，構文 解析 プログ 
ラムが与えられた状態に適用する規則がどれかを知るために必要である.例えば， 
〈式〉を 評価 するときには，構文 解析 プログラムはまず〈因子〉に関係する規則を 
適用する. 

この 文法の第2 の 特性は〈式〉 と 〈因子〉 の 定義が再帰的である ことで ある. 
ひとつの 〈式〉が，他の複数の〈式〉 の 代わりに定義される.〈因子〉 の 再帰性 
は2段階の深さがある. ひとつの 〈因子〉が ひとつの 〈式〉 の 代わりに定義され， 
〈式〉は〈因子〉の代わりに定義される.文法での再帰性は，文法を実現する構 
文解析プロ グラムで も再帰を使う こと ができる こと を意味する. 

適切な文法が与えられたら，文法を直接構文解析プログラムに変換することが 
できる.本章のプログラムでは，文法中のすべての非終端記号が同じ名前の等価 
なサブルーチンを 持つ.〈式〉 ( expr ) に対するサブルーチンは 104 行目から，〈因 
子〉 （ factor ) に対するサブルーチンは 124 行目から， 〈定数〉 に対するサブルー 
チンは 155 行目から始まる.図 8.11 の文法を再びみてみると，すべての 〈式〉 の 
規則 (1-5) のもっとも左の要素は〈因子〉であることがわかる.同様に，サブル 
ーチン expr ( ) の最初は，サブルーチン factor ( ) の呼出しである （108 行目）. 
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文法にもどって，〈式〉が次にすることは終端記号（*，/，+，一，ヌル•ストリ 
ング） を探すことである.それに対する プログラムは 110 〜 117行の switch 文で 
ある.デフォルトは終端記号ヌルになる（規則 1). 規則2から5の〈式〉の再帰 
的な評価は switch 文で行われる. 

サブル—チン factor () はもう少し複雑である.まず，規則7と9 の 先行するマ 
イナス記号をチェックする （128 〜132行）.マイナスを取り除くと規則6と7は等 
しくなる.同様に，規則8と9もマイナスを除くと等しくなる. factor () は，先 
行するかっこを探して処理する規則を決定する（134行目）. factor () がかっこを 
みつけなかったら， サブルーチン constant ^ ) を呼びだして規則8が処理される 
(135 行目）.かっこをみつけたら，かっこをとばして規則6が処理され， expr () 
が呼びだされる （138 〜139行）. expr () がリターン するとき’（’を探して エラー’ 
チェックをすることもできる. 

構文解析プログラムの最後の部分は，155〜169行のルーチン constants ) であ 
る.このルーチンは基本的には atoi () と等しい.しかし，数の直後に文字列ポイ 
ンタをすすめたり，数がなかったらエラーを示す. 

このプログラムには，コンパイラの3つの機能的部分が組み込まれていること 
に気づくだろう.はっきりしたトークン認識プログラムはなく，むしろ各ル—チ 
ンが，処理されるトークンをとび越すようにグローバル文字列ポインタ str を更 


呼出し 


_ parse( 

I 

' + • 

expr() - 

I I 
I I 2 

I I 

f actor() 

I I 
I I 2 

I I 

constant() 


6 


) 


I I 3 

I I 

expr() 

I I 

I I 3 

I I 

factor() 

I I 

I I 3 

I I 

constants ) 


■3 


リターン 


図 8 •13 構文解析（“2+3”， & err ) のサブル—チンの軌跡 
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新する責任を持っている.同様に，コンパイラのコード生成部分も構文解析プロ 
グラム自体に組み込まれている（コード生成は，実際にはさまざまなリターン文 
で肩代わりしている）. 

parse () 呼出しのサブルーチンの追跡過程を図8.13に示す.面白いことに，こ 
の図は式2+3の構文解析ツリーでもある.構文解析ツリーは本質的に構文解析の 
過程でつくられる.しかし，この構文解析ツリーはサブルーチン呼出しシーケン 
スで暗示されている. 

8.6 構文解析プログラムの改善 

さきの式解析プログラムは再帰のよい例であるが，やはり問題がある.これは， 
式を左から右に解析するが，実際には式を右から左に計算する（なぜなら，前 
の再帰レベルでできた結果を使って計算を行うから）.さらに，すべての演算子は 
同じ優先度で処理されている（本当は十と一は*と/より優先度が低い）.こ 
の2つの問題は文法を変更することによって除くことができる（注 2). 

演算子の優先度を直すことは簡単である.図8.11の文法規則を図 8*14 に示 
す形に変更するだけである.図 8*14 に新しい終端記号〈項〉が登場している 
(〈因子〉と〈定数〉の規則は図 8*14 には書いていないが前と同様である）. 

演算子の関係は，文法を少しかきまわしたので変更されている.図8.14の文法 
は右再帰である（再帰呼出しがプロダクションのずっと右にある）.右再帰プロダ 
クシヨンは，右から左に関係する.関係を変更するには，図 8-15 にあるように文 


く式〉 ：：=く項〉+ く式> 丨く項〉一く式> | く項〉 

く項〉 ：：= く因子〉 * く項〉| く因子〉/ <項> 丨く因子〉 

図8 • 14演算子の優先度つきの式文法 


く式〉 ：：=く式〉+ く項〉 丨く式〉—く項〉 丨く項〉 

く項〉 ：：=く項〉* く因子〉| く項〉/ く因子〉| く因子〉 

図8 • 15左から右への結合性をもつ式文法 


注2:ここでは，個々の変換がなぜ行われるのか説明せず，文法的な変換を示している.それらが行 
うことを忠実に取りさえすればよい.正式な文法とその処理という主題は，コンパイラの設計 
の本の方がもっと適切である.コンパイラの設計の本を参考文献にいくつかあげている. 
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8. 再帰とコンパイラ.デザイン 


図8 . 16式文法の最終形 


/^include < s t d i 〇 . h > 
//include <ctype.h> 


expr ( 


return expr_pr i me( termC 


8 
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24 
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28 

29 

30 

31 

32 

33 

34 

35 

36 
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38 

39 

40 

41 

42 

43 

44 

45 

46 

47 

48 

49 

50 


expr_prime( left 
i 

if( *Str 


return expr_prime( left + term( 


else if( *Str 


> 

else 


S t r + + ; 

return expr_prime( 


left - term( 


return le f 


term( 


return term_prime( factor 


term_prime( left 
[ 

i f ( * S t r 


S t r + + ; 

return term_prime( 


else i f( *Str 


S t r + + ; 

return term.prime( 


left 


return Left; 

図8.17 式解析プログラム 


-く項〉く式’〉丨 e 
/ く因子 >< 項’ > I e 
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式式項項 
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> > 

> t > » 

式式項項 

< < < < 












8.6 構文解析プログラムの改善 


219 


wh 1 Ie( (c = *Str) = = 1 + 1 || *Str 

て 

S t r + + ; 

left = (c == 

> 

return left; 


? left + tern 


term ( 


return term_prime( factor( 


term_prime( left ) 

register int 

wh i le( (c = *St r 
i 

S t r + +; 

left = (c =- 


|| *Str == 1 / 
left * factor( 


return left; 


7 

8 expr_prime( left ) 

9 i 

10 register int c; 


left - term( 


Left / factor く 


図 8 .18 右再帰を除くために変更された式解析 プログラム 


法を左再帰にする. 

しかし， この 最後の変換は，再帰的下向き構文解析には問題で ある.その 文法 

をできるだけ簡単なプログラムにすると，次のようになる. 

expr() 

て 

expr() ; 

> 

つまり， expr () は再帰的に自分自身を呼びだす.永久に その 処理を止める方法 
がないし， スタックは その 結果 オーバーフローしてしまうだろう.この 問題は， 
図 8-16 に示す よう な条件に少し文法を変更すれば解決できる. 

これらのプロダクシヨン中で， e は，“前にある演算子のいずれかで式が始ま 


expr ( 


return expr_prime( term( 


23456789012345678901234567890 

11111111222222222233333333334 
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ら なければ，何もしない”ということを意味する.この最終的な文法は図8.17 に 
示す サブルーチンに 直接変換できる（文法と同様に， サブルーチン factor () と 
constant () は同じものであるから，図8.17には 書いていない）. 

これらのサブルーチンには，まだかなり改善の余地がある. expr_primei ) と 
term _ prime () は右再帰である.つまりそれらの再帰的な呼出しは取後にイ了われ 
る （再帰呼出しとリターンの間には何もない）.したがって，再帰呼出しは while 
ループで 置き換えることができる.条件付の if / else 文で置き換えることもできる. 
この変更は図8.18で行っている. 

expr _ prime () から，すべての再帰呼出しを除くための簡単な変更か他('■もあ 
る （ expr _ prime () は自分自身を呼びださないで， expr _ prime () が呼びだすサブ 
ルーチンが直接 expr _ prime () を呼びだす）. expr () がすることは expr _ prime () 
を呼びだすだけだから，行3の expr _ prime () へのサブルーチン呼出しは expr _ 
prime () 自体で置き換えることができる. term () と term—prime () にも同じ 
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expr ( 


r eg 1 s ter i nt c ; 

register int left; 

left = t e r m(); 

whi le( (c = *Str) == ' +' | | *Str 

S t r + + ; 

left = (c == 

> 

return left; 


? I ef 


register int 
register int 

left = f a c t o r() 

wh i l e( (c = *Str 

S t r + + ; 

left = (c == 

> 

return left; 


II *Str 


? Left * f ac tor( 


/ factor( 


図 8 •19 expr () と term () の最終版 
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ことがいえる.これらの変更を行った expr () と term () の最終プログラムは図 
8-19 に示されている. 

8.7 練 習 

8-1 次の再帰サブルーチンを書きなさい. 

search ( array, key, array_size ) 

1nt *a r r ay , key, array_size; 

これは，そこに示されている整数配列に key を探す 2 分探索を行う. array , 
size は配列の要素の数で，バイト数ではない.このルーチンは key が発見 
されたセルへのポインタをかえす（また， key が発見されなかったら_1を 
かえす）. 

8-2 自分のスタック•フレームの大きさを，バイト数でプリントする C 言語の 
サブルーチンを書きなさい.この大きさは実行時に計算すること（サブルー 
チンを10〜15行より大きなプログラムにすると，たいへん悪いことになる 
だろう）. 

3-3 練習 8-2 の原則を使用して，式解析プログラムが式全体の解析に使用する 
スタックの最大量を， parse () がプリントするように式解析プログラムを 
変更しなさい（つまリ，再帰のもっとも深いレベルで使用可能なすべての 
スタック•フレームの大きさの和をプリントする ）. parse () 自体に使用さ 
れているスタック.フレームの大きさがこの数に含まれているはずである. 
“（（1*2) + (3*4))” の計算にどのくらいのスタックが使用されるか？ 

8-4 本章で説明した構文解析プログラムを使用して，式“1+(2*3)” を解析 
し，各サブルーチンの呼出しの後でそれらのスタックとサブル_チンの追 
跡図を示しなさい.すべての変数とアドレスが各々2バイト必要だとする 
と，この式を計算するのにどのくらいのスタック•メモリを必要とするの 
か？ どのくらいスタックの必要量を減らすことができるか？ 再帰レべ 
ルを制限するためにどのように parse () を変更することができるか？ 

8-5 標準入力から対話的に文を入力し，その文を評価する卓上計算機プログラ 

ムを書きなさい.その計算機は，任意の英文字名を持つ任意の数の変数を 
サポートしていなければならない•文 “< name > = < expr > ; ”が蛮数を生成 
し（まだその変数が存在していなければ）， < expr > の値をその変数に割り当 
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てる.その後，その変数は式中で数の代わりに使うことができる. print 文 
(“print < expr >;”） は式の計算の結果を標準出力にプリントする.次の文法 
を使用する. 


<s tmt> 
<expr> 
<expr 1 > 
<t e r m> 
<term ' > 
<fac t> 
<const> 
<num> 
<name> 


=print <expr> ; <stmt> | <name> = <expr> ; <stmt> | t 
= <term> <expr'> 

= + <term> <expr 1 > | - <term> <expr'> | t 

= <f ac t> <term ' > 

=* <f ac t> <term'> | / <fac t> <term 1 > | t 

=(<expr> ) I - ( <expr> ) j <const> | -<const> 

=<num> | <name> 

= ’0’ から’ 9’ の範囲の ASCII 文字の文字列 
= ， a ’ から’ z ’ の範囲の ASCII 文字の文字列 


文はすべて セミコロンで 終わる. エラー（セミコロン や等号がないなど） 
があったときは適切な対応を行いなさい. 





9 Printf () の構造 


本章では， C 言語の特徴全体を使用するサブルーチンである p rintf () のインプ 
リメ ン テー シヨンを書くことによって，前の章で取りあげた点をいくつか応用 
する. printf () は，洗練されたやり方でポインタを使用している.不定数の引 
数を持っている.そして，キャスト，型変換などをよく理解している必要がある. 
printf () は，現実的なプログラミングの例でもある. printf () を書いたときに多 
くの妥協をしており，多くの同様な妥協が，現実のプログラムを書くときにも行 
われる（参考書のプログラムと比較すると）. 

9.1 スタックの再考 

printf () にとり組むまえに，問題の範囲を少し減らしておこう.次のサブルー 
チンは，自分のリターン•アドレスをプリントする. 

typedef int (*PF I )() 

printaddr( a r g ) 

て 

P FI *argp = &arg ; 

printf( "printaddr: called from 0x%0Ax\n", argp[-1 ])； 

printaddr () がどのように動くかみるために，スタック •フレームを 調べてみ 
上う. 
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I | アドレス <-SP 


argp : 

1 » 

1 - 1 

| 106 | 

100 


j 前フレーム•ポインタ | 

102 


1 一 - | 

| リターン•アドレス | 

104 

arg : 

1 -- 

| パラメータ | 

1 - 1 

1 1 

106 


式 &arg は arg のアドレス，106を計算する.したがって， argp = &arg は106 
を argp に入れる. argp はポインタだから， argp [0] はアドレス106にあるセルの 
内容である. argp はポインタの大きさのオブジェクトへのポインタだから， argp 
[—1] は argp の内容からポインタの大きさをひいたアドレスにあるセルをアクセ 
スする.この計算機ではポインタは2バイト必要とし， argp は106を含んでいる. 
それで， argp [- l ] は 106-2 (104 番地）にあるセルを参照する.セル104は，サ 
ブルー チンのリターン.アドレスを保持している. 

このルーチンは移植性はない.しかし，たいていのコンピュータで動作する. 
スタック•フレームがある方法で構成されるとする.実際はコンピュータによっ 
てスタック•フレームの構造は少し異なる.しかし，リターン•アドレスと弓 I 
数の相対位置はたいてい同じである. printaddr () もサブルーチンへのポインタと 
サブルーチンのリターン•アドレスが同じ大きさであると想定している•これは 
よい考えであるが，必ずしもそうではない.しかし， printaddr () は， C プログラ 
ムがどのように直接スタックをアクセスするのか説明するのに役立つ . pnntfl ) 
がどのように動作するのか理解するために， printaddr () の処理を理解する必要が 
ある. 

9.2 printf () 

printf () と fprintf () の ソース •プログラムを図 9.1 に示す. extern 文の構文を 
よく知らないかもしれない.それは審議中の ANSI 規格に規定されている構文で， 
サブルー チンの引数の型チェックを強力に行う•その文をさきの規格ではファ 
ンクション•プロトタイプ (function prototype ) と呼ぶ.（今のところは Microsoft 
と Lattice のコン パイラで サポート されている.他の コン パイラ. メーカーは始 
めたばかりである）.宣言 

extern void doprnt ( int (*)( 〉, int, char* # char** ); 
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2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 

13 

14 

15 

16 
17 


# include < s t dio.h > 

extern void doprnt ( int (*)(), int, char*, char** ); 

extern void fputc ( int # FILE * )； 

p ri n t f( format, args ) 
char * f orma t, * a r g s ; 

て 

doprnt( fputc, stdout, format, &args ); 

f p rin t f( stream, format, args ) 

FILE *s t r earn ; 

char * f o r m a t , * a r g s ; 

て 

doprnt( fputc, stream, format, &args ); 

図 9 •1 printf() と fprintf() 


は ， doprnt () が値をかえさない（それが void である）サブルーチンであるといっ 
ている.これは4つの引数をとる.最初は int をかえすサブルーチンへのポイン 
夕である. 2番目は int ， 3番目は char へのポインタ，そして，4番目は char ボイ 
ンタへのポインタである.型の並びにある構文は，キャストに対する構文のよう 
である（ただし，キャストの外側のかっこは除く）.コンパイラはこの引数並び 
に適合しない型や，引数の個数の間違い，間違って使用された返り値をみつけ 
たら， エラー•メッセージを プリントする（通常は重大な エラーで はなく，警告 
をだす）.可能ならば，コンパイラはサブル_チンをうまく呼びだすために必要な 
型変換を行う.不定数の引数を持つサブルーチンもまた規定することができる. 

例えば 

extern void printf(char *•...) ; 

型並びの省略符号が，最初の char ポインタの引数にどんな型の引数がいくつ続 
いてもよいことを表している（注 1). 

みてわかるように， printf () は5行の長さしかない. printf () は仕事の大半を 
行うために，便利に使える関数 doprnt () を呼びだす. fprintf () も同じ関数を呼 
びだす.それで， doprnt () は，いくつか特別な関数を書くよりも，汎用の便利な 
関数をひとつ書いて，プログラムの大きさを小さくするというよい例である. 

doprnt ( ；に話を移す前に ， doprnt () に渡される引数を調べてみよう. 

注1: ANSI 規格の初期の案では省略符号を使わず，カンマのみであった. 
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doprnt () への最初の引数は，出力関数へのポインタである.その関数は 

(* out) ( c, 0 -param ) ; 

で間接的に呼びだされる.ここで， c は出力する文字であり， o_param は doprnt () 
への2番目の引数である.つまり， o_param は fputs () へ引数列を渡すための 
手段を与える. doprnt () 自体は o_param を使用しない. doprnU ) の3番目 
の引数は， printf () に渡されたのと同じフォーマットの文字列へのポインタで 
ある • 4番目はその他の引数へのポインタである.いいかえれば，4番目の引数 
はスタック上にある printf () への引数のアドレスである.そのアドレスにすぐ 
フォーマットを書いてある文字列が続く.その状態を図 9.2 に示す • 


呼出し 


は 


x=4;y=3; 
printf( "%d %d", x, y 


dopr n t( fputc, s t dou t , 

を呼びだす . 

次のようなスタックフレームが 生成 される . 


format , 


&x ) ; 


1 

1- 

1 

1 

1 

dopmt の口ーカル 

引数 

100 

dopmt のスタック•フ 

レ ー 


1 ■ 

FP-> | 

前フレーム • ポインタ | 

102 




1 - 
1 

リターン . アドレス 1 

104 




1 ■ 

ou t : | 

fputc のアドレス 1 

106 




1 

〇 -param :| 

stdout | 

108 




1 

format :| 

〇 n 士 1 





〇 U 買 —-1 


1 



1 • 

- ap : | 

120 

112 

1 

1 



1 . 

FP-> | 

前フレーム . ポインタ | 

114 

| printf のスタック • 

，フレーム 


1 

1 

リターン•アドレス | 

116 

| 80: 81: 82: 

83: 8A : 

: 85: 

1 

format :| 

p A if __ — — 1 



% | ' d ' 

| '\ 〇 ' 

〇 U 再-一 - | 



1 

--> ar gs : | 

A 

120 

1- 



1 

1 

3 

122 




1 

x : | 

4 

124 

呼出しをしたルーチンのスタ 

ック•フレ 

ーム 

1 

y : 1 

3 

126 




1 

FP-> | 


128 





図9 . 2 doprnt ( ) の引数 
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printf () が呼びだされるとき，3つの引数は逆順にスタックにプッシュされ 
る.そのため変数 y の内容は122番地にプッシュされ， x の内容は120番地にプッ 
シュされる.フォーマットの文字列へのポインタは，118番地にプッシュされる. 
リターン•アドレスは，サブルーチン呼出しの一部としてプッシュされ，それか 
ら printf () が前のフレーム•ポインタをプッシュする • printf () は ローカル 変 
数を持たないから，スタック•フレームはそれで終わりである. 

printf( ) が doprnt( ) を呼びだし， doprnt( ) への引数が呼出し処理の一部と 
して逆順にスタックにプッシュされる.はじめに fputc( ) へのポインタ （ fputc() 
サブ ルーチンの 最初の命令のアドレス）がまず プッシュ される. f putc ( ) への 2 
番目の引数は stdout である.次に stdout が，スタックにプッシュされる.そし 
て， printf ( ) へのフォーマット引数の内容が次にプッシュされる.そのため， 
スタック上には，フォーマットの文字列への2つの同一のポインタが存在する. 
ひとつは printf () のスタック.フレ_ム上に，もうひとつは doprnt( ) のスタッ 
ク•フレーム上にある.最後に， args の アドレスがプッシュされる. 

args は，実際にいくつの引数が printf () に渡されたかということには関係な 
く，いつも同じ printf () スタック •フレームの相対 位置にある.つまり， args は 
いつも フレーム •ポインタから同じ オフセットの ところにある.いくつかの引数 
が，スタック上の args に続く （より上位のアドレスにある）.サブルーチンの引 
数は逆順にプッシュされるため，最初の引数が，スタック •フレームの どこに位 
置しているか必ずわかる.このことを知らないで，不定数の引数を持つサブルー 
チンを書くことはできない. 

9.3 doprnt () で使用されるマクロ 

doprnt () の頭の部分を図 9.3 に示す. 

2つの外部ルーチン ltos () と dtos () が使われている（13，14行で宣言されて 
いる）.その2つについて簡単に述べる. 

2つのサブル_チンには# define のように extern 文が続く （26 〜30行）. dopmt () 
を書くときに行った取引のひとつは，実行速度対プログラムの大きさだった.プ 
ログラムの実行時間の多くはたいてい I / O 動作を行うために費やされるから，速 
度を考えて printf () を最適化するのが合理的なように思われる.したがって，サ 
ブルー チンを実行するためには余分な時間がかかるから ， dopmt () のサブ ルー チ 
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33 
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DOPRNT / FDOPRNT 

printf , sprintf 等の実際のフォーマッティング•ルーチン 

— 変換をとサポートするために FLOAT を# define する（これはコマン 
ドの w / a — dFOLAT オプションによって行われる.この場合， 

コンパイルされたサブルーチンは dopmt () より fdoprnt () を呼び 
だす. 

—標準ではない変換 ％b (2 進）変換をサポートしている. 


extern char 
extern char 


* L tos(long, char* ,int); 
*dtos(doubLe, char*, in t); 


下の命令コードのメモリを節約するためのマクロ.コンパイラが複数のマク 1 
を許容しないならば，逆スラッシュを削除して，定義全体を1行にまとめる、 
と. 

PAD(fw) filchar を fw 回出力する. fw =0. 

T0INT(p,x) p が数を越えるところに更新される以外は 
x = atoi ( p ) ;のように動く. 




#define PAD(fw) 


wh i l e ( --fw >= 0 ) 

(*ou t) ( fUchar, o — param 


//define T0INT(p,x) wh i l e ( 'O' <= *p && *P <= ' 9, 

x = (x * 10) + (*p++ - '0') 


*/ 


INTMASK は long の 下位 N ビットを マスク して移植性を持たせる方法であ 
る. ここで， N は int のビッ ト幅. 


//define INTMASK 


(l ong)( (unsigned) に 0)) 


多くのコンパイラは次の式を受け人れない. 


int 
x = 


^ap; 

〔Long *)ap )++ ； 


したがって，次の形を使用してきた. 


char * a p ; 

x = *( (Long *) ap ); 
ap += sizeof(long); 

あまリきれいではないが，このほうが移植性がある. 


*/ 


# def 1 ne NEXTARG(x, type) 


x = *(type *)ap; 
ap += sizeof(type); 


(図 9.3 つづく） 
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- - 

* FLOAT が# define されていれば，サブルーチン名として fdoprnt が使用さ 

* れる. # define されていなければ， dopmt が使用される. 


ffifdef FLOAT 

//define DOPRNT fdoprnt 

/S/e L se 

#define DOPRNT doprnt 

# e n d i f 


図 9 . 3 doprnt.c • #define 等 


ン呼出しの回数を少なくする.いっぽうで，サブルーチンの構成（サブルーチン 
を独立した単位にし，呼びだすルーチンとは分離する）がプログラムをより維持 
管理しやすくする.マクロのようなサブルーチンを使用することをおすすめする. 
しかし，これらのマクロにはそれの波及効果などには注意しなければ ならない. 
例えば，（誤った）マクロの呼出し 

TOINT( p++, x ) ; 

は，次のように展開される. 

whiL e ( ' 0 1 <= *p + + && *p + + <= '9 1 ) \ 

x = (x * 10) + (*p + + + + - ' 0 1 ) 

p の最初の 2 つの展開は， p を2回インクリメントするという望ましくない結果 
になった. 3番目の展開 p + + + +は規則違反である.その他にも問題がある. 
T 0 INT が正しく使用されていたとしても， p は走査するけたを通り過ぎてしまう 
だろう.サブルーチンはけたを通り過ぎることはない（少なくとも直接には）.そ 
れでサブルーチンが正しく使用されたときでさえ， マクロ は波及効果を及ぼす. 
もうひとつ考えなければならないことは， マクロ を次の行に続けるために使う逆 
スラッシュである.プログラムは，きちんとフォーマットされていれば言壳みやす 
い.しかし，コンパイラの中には複数行の マクロ をサポートしていないものもあ 
る.このようなコンパイラでは，定義を1行にまとめなければならない. 

次の# define は行37にある. 

//define INTMASK ( long) ( ( uns i gned ) ( ' 0 )) 

INTMASK は long を等価な int 切り捨てるために使用される.つまり，32ビット 
の long を16ビットの int にする. 


901234567890 

566666666667 


I ongvar &= INTMASK ; 
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は数の上位16ビットをクリア （ 〇にセット）する•式 

#define INTMASK Oxffff 

は動作しない.ここで問題になるのは自動型変換である. Oxffff は int である. 
そしてそれは負数 （一1) である.式が long と int の両方を含んでいるときには， 
式が計算される前に int が long に変換される. Oxffff は負数だから ， Oxffffffff 
に変換される（符号拡張のため）.だから ， longvar &=0 xffff はコンパイラには 
longvar &= Oxffffffff として扱われ，その式は何もしないだろう.この問題は次 
のようにして避けることができる. 

//define INTMASK Oxf f f f L 

最後の L は，コンハ。イラに Oxffff が32ビットの long で，下位16ビットを1 
にセットするように知らせている.しかし，このプログラムは移植性がない • int 

は16であると想定している.式： 

//define INTMASK ( Long) ( (unsigned) (~0)) 

は移植性がある. int の大きさを想定していない.ここで，〜〇は全ビットが1に 
セットされている int の大きさのオブジェクトである.この数が long で式中に使 
用されているとき，符号抗張を避けるために， unsigned にキャストする.最後に 
この数を long にキャストする. 

しばらくの間， NEXTARG の# define を調べてみよう. 65〜69行にある次の 
社 define は，最後のサブルーチンの名前を決定する. FLOAT が# define されてい 
たら，そのときはサブルーチン名は fdoprnt () である.そうでなければ， doprnt () 
である.同じソース•プログラムで，このようにひとつのサブルーチンから2つ 
の変形版を生成するために使用することができる.ひとつは浮動小数点をサポー 
卜する fdoprnt () を呼び，もうひとつはサポートしない doprnt () を呼ぶ. 

9.4 スタックからの引数のフェッチ 

もうすでに doprnt () への不定数の引数について述べてきた. ap ， （スタック 
上の）その引数へのポインタ，は文字ポインタとして宣言されている.これは， 
コンパイル 時には引数の型はわからないので，必要である.フォーマット文字列 
を解析して，実 fi 1 時にこれらの型を推定しなければならない （％ d と％ c は int 
の大きさの引数に対応し，％ f は double の大きさの引数に対応する等）. ap をひ 
とつの引数から他の引数にインクリメントさせるとき， ap にはさし示される才 
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1 nt 1 ntvar ; 

long longvar ; 

double doublevar; 


p r 1 n t f (" 

%d,%ld 

,%f" , i 

ntvar, longva r , 

doublevar ) ; 



ap を次のよ 

うに初期化する： 


PRINTF のスタック 

1 

1 

1 

1 

DOPRNT のスタック 

フレーム： 


1 

1 

フレーム： 



1 

1 -- 一 

1 

ap : 

l n t v a r : 

100: 

1 

1 

I _ 

| 、 - 

| -- 

-|—— * 100 

l ongvar : 

102: 

1 

1 

' ~ 1 

1 

1 - - 


104: 

1 

1 


doubleva r 

: 106: 

1 - 

1 

_ __ | 

I 



108: 

1 

1 



110: 

1 

1 



112: 

1 

I _ 

1 

—— 塞■■鑛■ — 一 1 




1 

1 

| 

1 



図 9,4 引数ボインタの使用 


ブジェクトの，スタック上のひとつの引数の，大きさを加えなければならない. 
ap を char ポインタにすることで，このインクリメントは簡単に行うことができ 
る. char ポインタのポインタ計算はただの計算である. char ポインタに1を加 
えることは，実際にそのポインタの内容に1を加える（なぜなら. sizsof ( char ) 
==1だから）. 

ap が doprnt () でどのように使用されているかみてみよう. printf () の呼出し 
とその結果のスタック•フレームを図 9.4 に示す.ここで， ap は printf にある 
フォーマット文字列 (& args ) が続く最初の引数をさし示すように初期化される. 
ap にさし示されているオブジェクトをフェッチするためには，次のようにしなけ 
ればならない. 

1 n t x ; 

x = *( (int *)ap ); 

ap は char ポインタだからキャストは必要である. ap は char へのポインタとい 
うより，むしろ int へのポインタであるかのように扱われる.式 

X = *ap; 

は int で使用される2バイトでなく，1バイトをフェッチするだろう.式 x = 
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* ((int * ) ap ); は ap にさし示されるオブジェクトをフェッチする.しかし，そ 
のオブジェクトは， char の大きさでなく int の大きさである•だから int 全体を 
フェッチする. 

ap を，その int を過ぎて次の引数をさすようにインクリメントするには， ap 
に int の大きさを加えなければならない. 

ap += s 1 zeof(int ) ; 

ap は char ポインタであるから， ap には2をカロえる.この新しい状態を図 9.5 に 
示す. 


x = *( (int *)ap ) ; 
ap += sizeof(int); 

次のように行う： 


PRINTF のスタ 

ック 

1 

1 


1 

1 

DOPRNT のスタック 

フレーム： 


1 

1 


1 

1 

フレ 

—ム： 

1 ntvar : 

100: 

1—— 
1 

3 

——| 

1 

1 

ap : 

1 


longvar : 

102: 

1 ■ 
1 


-| 

| <- 

—-I-- 1 

► 102 


104: 

1 


1 

丨 —— 


doublevar : 

106: 

1 

1 


- I 

1 




108: 

1 


1 

X : 



110: 

1 


1 

丨 一一 



112: 

1 

I 一 • 


1 

I 

1 

1_ 

3 



1 

1 


1 

1 

1 



図 9 • 5 引数ボインタの更新 


ap は，今スタックの2番目の引数 longvar をさし示している.前と同じように 
してこの値をフェッチすることができる.しかし，異なるキャストを用いる. 

Long I x ; 

Lx = *( (long *) ap ); 
ap += s i zeof( long ); 

は， ap にさし示されている long の大きさのオブジェクトを lx に入れる.そして， 
ap に4 (long の大きさ）をたして， ap が double をさし示すようにする.この新し 
い状態を図 9*6 に示す. 

















9.4 スタックからの引数のフェッチ 


233 


doubIeva r : 


図 9*6 引数ポインタを再度更新する 


double は 

double dx ; 

dx = *( (double *)ap ); 
ap += s i z e o f( double ); 

でフェツチすることができる. NEXTARG ( x , type ) マクロは， 示された型の引 
数をフェッチして，それを x に入れる.それから，その引数を過ぎるように ap 
をすすめる. NEXTARG ( lnum , long ) は次のように展開される. 

Inum = *(Long *)ap ; 
ap += slzeof(long); 

> 

NEXTARG の本体は’ { } ，で囲まれている（なぜなら，2つの文からできている 
から）.次のように書くことができる. 

1 f( cond 1 tion ) 

NEXTARG( x, int ); 

しかし，最後の else は’}’ の ために問題が起こる.ここでは セミコロンは if に 
続くヌル文として解釈される.この問題を訂正するためには， セミコロンのひと 
つを削除する. 


Iongvar 


102 : 

104: 


-一| ■ 


106 


100 : 


ap : 


x = *( (long *)ap ) ; 
ap += s 1 zeof(long); 

は次のように行う： 


PRINTF のスタック 

フレーム： 


DOPRNT のスタック 

フレーム： 


3 


70000 


0 011 
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9. Printf () の構造 


if( condition ) 

NEXTARG( x, int ) /* No ; */ 

else 

NEXTARG( x, int ); 

このようなことをするときには，セミコロンがないことがエラーにみえないよ 
うに，プログラムに必ずコメントをつける必要がある. 

ひとつのマクロに2つの文がある問題を処理する他の方法は，コンマ演算子を 
使うことである.次のように NEXTARG を# define することができる. 

//define NEXTARG(x, type) x=*(type *)ap, ap += sizeof(type) 

ここで，コンマ演算子の左から右の評価を行う.この式は読みにくい（少なく 
とも筆者にとっては）. 

NEXTARG には他に2つの方法がある. 

#define NEXTARG(x , type) x = *( (type *) p )++ 

はスタックから引数を取り出して，ポインタをひとつの動作で更新する•しか 
し，多くのコンパイラはこの文を受け人れない.問題は，コンパイラが使用する 
一時的な変数 rvalue を処理しなければならないことである.キャストされた数の 
値は，しばしば rvalue に入れられる.つまり，キャストは変換されるオブジェク 
卜の大きさをかえるから，このオブジェクトはしばしば名前のわからない一時変 
数に入れられる.この場合，上の式はコンパイラに， p 自体ではなく，一時変数 
rvalue をインクリメントするように教えている. rvalue をインクリメントしても意 
味がないから，多くのコンパイラはこの式を拒絶する. 

NEXTARG のもうひとつの方法は 

#define NEXTARG(x,type ) x = ((type *)( p += sizeof(type)))[-1] 

である . ここで， p は char への ポインタである. p は+=を使って取り出したい 
オブジェクトを越したところに更新される. [—1] で新しい位置からの指標づけを 
して，スタックを逆にもどる.キャスト演算子は+=よりも優先度が高く，か 
つ [] よりも優先度が低いので， この 式のすべてのカッコが必要である. 

9.5 doprnt() : プログラム 

doprnt () の実際のプログラムが図 9.7 に示されている.プリントが簡単な場 
合，つまり変換を行う必要がない場合は，94〜99行のプログラムですべてが行わ 
れる.一度に1文字ずつフォーマットの文字列を走査して，直接出カルーチンを 
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char 

*D0PRNT (out, o_pa 

int 

(*out)( 

>； 

int 

〇 -param J 

f 

char 

♦format; 


char 

*ap; 


i 

char 

f i lchar 


char 

nbuf[34 


char 

*bp 


int 

s l en 


int 

base 


int 

f Idwth 


int 

prec 


int 

Iftjust 


int 

l ongf 


l ong 

l num 


# i f def FLOAT 

double 

//end i f 


format, ap) 

/* 出カサブルーチン 
/* out () に渡す第 2 引数 
/ * フォーマット文字列へのボイ . 
/* 引数へのポインタ 


/* 

/* 

/* 

/* 


/* 

/* 


欄を埋めるために使用される文字 */ 

変換された文字列を保持するバッファ */ 
現在の出カバッファへのポインタ */ 

bp にさし示される文字列の長さ */ 

現在の基数 （％ x =16, % d =10, 等） */ 
%10 x にあるような フイールドの 幅 */ 

%10.1 Ox か％ 10.3 f での精度 */ 

1=左をそろえる.（例， %-10 d ) */ 

longint でする . （％lx か％ Id ， 等） */ 
数値引数を保持する */ 


/* double の引数を保持する 


ormat 


formats 


if( *format != 1 % ') 
i 

(*out)(*format # o_param); 


else 


変換しない */ 

次の文字をプリントする */ 


%変換の処理 


bp 

filchar 
f l d w t h 
l ft just 
l ong f 
prec 
s l en 


nbuf 

言 曹 
0 
0 
0 
0 
0 


/* 変換文字の前におくことのできる文字を解 
* 釈する（％〇4..., %—10.6...，等）. 

* フイールドの幅の代わりに*があったら幅は 
* 引数並びから得る. 

*/ 


if ( 

* + + format == ' - 1 ) 

•C + + f ormat ; 

+ + l f t j u s t ； > 

if C 

♦format = = ' 0') 

C ++format ; 

filc h a r = 'O'; > 

if ( 

♦format != 1 * 1 ) 




TO I NT( format ( 

r f l dwth ); 


else 





Tormat++; 

NEXTARG( fldwth, int ) ; 


if( *format == 1 .' ) { + + format; TO I NT<format, prec);> 
if( *format == ' l ' ) { + + format; ++1ongf ; > 


* 今まですベての修飾文字を取り上げ， * format は実際の 

* 変換文字を調べている.適切な大きさの引数をスタッ 

* クから取り出して，ポインタ ( ap ) を次の引数をさし示 

* すように更新する. 


(図 9.7 つづく） 
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9. Printf () の 


構 


造 


s w i t c h ( 
i 

default: 

case ' c' 


►format 


*bp + + = 11 
break; 

NEXTARG< 

break; 


*bp++, int ); 


NEXTARG( bp, char *); 
break; 


NEXTARG( dnum, double ); 
if( dnum < 0 && filchar 


/* 0 で空白をうめてしまうのならば， 

* “0000-5.2.” にしないように，一を 
* ブリントしなければならない . 


--f I d w t h ; 


,o_par am) 


> 


dnum 

=-dnum ; 

bp 

br 

eak 

dtos( dnum, bp, prec 

case ' 

d 1 : 

base 

goto 

=10 ; 
pnum ; 

case ' 

x • : 

base 

goto 

=16 ; 
pnum ; 

case ' 

b 1 : 

base 

goto 

= 2 ; 
pnum ; 

case ' 

o 1 : 

base 

= 8 ; 


/* 次の文へ抜け落ちる*， 

/*long や int の大きさの引数をスタックから適切 
* に取り出す . 取り出された数が基数 10 の int でな 
* かったら，符号拡張が起きないように上位ビット 
* をマスクする . 


1 f( longf ) 

NEXTARG( lnum, long ) 

else 

NEXTARG( Inum, int )； 
i f( base !=10 ) 

Inum &= INTMAJ 


> 

if ( 


L num < 0L && base 


10 && 


/* “000-123.” とならないように，一をプリ： 
★ する .10 進数だけが一符号を得る . 


<*out)( ( 

--fIdwth ; 
Inum = -Inum 


o_param) 


9 ) 123^567890123456789012345678901234567890123456789012 
3444444-44445555555555666666666677777777778888888888999 
111111111111111111111111111111111111111111111111111111 


34567890123456 

99999990000000 

11111112222222 


( 図 9.7 つづく） 



9.5 dopmt () :ブログラム 


237 


207 

208 

209 

210 
211 
212 

213 

214 

215 

216 

217 

218 

219 

220 
221 
222 

223 

224 

225 

226 

227 

228 

229 

230 

231 

232 

233 

234 

235 

236 

237 

238 

239 

240 

241 

242 

243 

244 

245 

246 

247 

248 

249 

250 

251 

252 

253 > 

254 


bp = ltos( Inum, bp, base ); 
break ; 


/* 必要ならば文字列を終わりにして文字列の長 

* さ （ slen ) を計算する. bp は出力する文字列 

* の始めをさし示す. 


if (*format != 's') 

*bp = '\0 '; 

slen = bp - nbuf; 
bp = nbuf ; 

else 

slen = strlen(bp); 
if( prec && slen > prec ) 
slen = prec; 


/* Adjust fldwth to be the amount of padding we need 

* to fill the buffer out to the specified field 

* width. Then print leading padding (if we aren't 

* left justifying), the buffer itself, and any 

* required trailing padding (if we are left 

* justifying). 


if( (fldwth -= slen) < 0 ) 
fldwth = 0; 


if ( ! If t j u s t) 

PAD( fldwth ); 

w h i l e( --slen > = 0 ) 

(♦out)(*bp++ / o_param); 

i f ( l f t ] u s t) 

PAD( fldwth ); 

/* else 終わり 

/ * end for( ; *format; format + +) 


*/ 


図 9 • 7 doprnt.c の続き： doprnt () 本体 


呼びだして文字をプリントする.サブルーチンの残りの部分は，％変換を行う 
else 節である. else 節は100〜252行まである. 

102〜120行までのプログラムは，変換の修飾文字を取っておく変数を取り扱う. 


それらはデイフォルト値に初期化された後，必要に応じて変更される. fldwth は 


フイ ールドの幅に設定され， fit just It %文字に続いてマイナス記号があったら真 
に設定される.変換 ％ …は認められている.ここでは*は フイー ルドの幅を 

引数並びから取りだすことを意味している.この方法は 

p r 1 n t f(" % * d" , width, x ) 
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9. Printf () の構造 


で printf () を呼びだして， x を幅 width でプリントする.しかし，表記“％*.* f ” 
はサポートされ ていない. 精度（小数点の右側）を規定するにははっきり数を書 
かなければならない. 

変換は，140〜209行にある switch で行なわれる.引数はさきほど述べた方 
法で， NEXTARG マクロを使用して，スタックから取りだされる. ％ c 引数は 
int で文字が渡されるので， int としてフェッチされることを思いだしなさい.同様 
に， ％ f に対応する引数は double で渡される.192行目の if は，整数の大きさ 
のオブジェクトが ltos () に渡され，その整数が基数10でプリントされないとき 
に，符号拡張が起こらないようにするために必要である （ l tos () については後述 
する）. 

switch から離れるとき，変換は完了している.そして，変換された数を表す 
ASCII 文字列は bp にさし示される文字列に入れられている.そのバッファは，必 
要な空白等をつけて，242〜249行でプリントされる. 

9.6 構造化プログラミングの考え方 

doprnt () は，適切な構造化サブルーチンの例ではない.しかし，5章にある規 
則から逸脱しているところにはすべて理由がある.まず第1に， dopmt () は実打 
速度を上げるために，サブルーチンとしては長い.長いためになってしまった for 
ループ （94 〜252行で終わる）の外側の大きさと else 節の長さ（101〜251行まで） 
は望ましくない結果である.この else に関係する if は， if 文の近くにもっとも短 
い動作をおくように構成されている. 

1 f( *format == ' % ') 

だったとすると， if 節は数ページの長さになり，それからやっと 

else 

(*out)( *format , o_par am ); 

が現れる.しかし，読むとたぶんその else に関係する条件は何だったのか忘れて 
いるだろう. if / else の先頭に短い動作を移動するとこのプログラムは読みやすく 
なる. 

doprnt () の実行速度をはやくするプログラムには他にも2, 3心配な部分があ 
る.第1に case ， f ， 文の本体 （152 〜168行）は switch の大きさを減らすために 
サブルーチンにするべきである.同様に ， case ’〇’ の本体も先行する全 goto 文 



9.6 構造化プログラミングの考え方 
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#ifdef DEBUG 

# include < stdi 〇 .h > 

prlntm (Tormat, args ) 
*format; 

*args ; 


255 

256 

257 

258 

259 

260 
261 

262 cha 

263 char 

264 { 

265 

266 

267 

268 

269 

270 

271 

272 } 

273 

274 /* —— 

275 

276 main( 

277 i 

278 


printf の変形版のひとつ.デバッグ用に実際の printf を 
使用することができるように printm () が呼ばれる. 


extern int fputc(); 

DOPRNT( fputc , s tdou t, format , &args 


279 



0,1 

,2, 3L, 4L # 

51, 6 

.7, 

' 8 

., 11911 

280 









281 

printm("%s %s 

%c •し 

"hello", "world". '\n ' 


)； 



282 

printm( M should 

see 

< s t r i n g > 

<% 6.6 s >\n" 

,"s t r 

i ng 

NO 

NO NO" 

283 

printm("should 

see 

<70000> 

<%Ld>\n" f 

700001 

>; 



284 

printm("should 

see 

<fffff> 

<%lx>\n«' Oxf f fff L); 



285 

printm("should 

see 

<ffff> 

<%x>\n», 

-1 

) ； 



286 

printm("should 

see 

<- 1 > 

<%ld>\n», 

-1 L 

) ； 



287 

printm("should 

see 

<x> 

<%c>\n", 

'x ' 

) ； 



288 

printm( n should 

see 

<a5> 

<%x>\n ", 

0xa5 

) ； 



289 

printm("should 

see 

<765> 

<%o>\n", 

0765 

) ； 



290 

printmC should 

see 

< 1010 > 

<%b>\n» , 

Oxa 

) ； 



291 

printm("should 

see 

< 123> 

<% 6 d>\n", 

123 

) ； 



292 

printm( H should 

see 

< 456> 

<%*d>\n", 

6,456 

)； 



293 

printm("should 

see 

< -123> 

<% 6 d>\n •し 

-123 

)； 



294 

printmC' should 

see 

<123 > 

<%- 6 d>\n" # 

123 

> ； 



295 

printm("should 

see 

<-123 > 

<%- 6 d>\n", 

-123 

)； 



296 

printm("should 

see 

<-00123 〉 

<%06d>\n», 

-123 

)； 



297 









298 #ifdef 

FLOAT 








299 

printm("should 

see 

< 1.234> 

ぐ/。 6 .3f>\n" 

# 1 . 

234 

)； 


300 

printm("should 

see 

<01.234> 

<%06.3f>\n 

",1 . 

234 

)； 


301 

printm("should 

see 

< 1 .010 > 

<%- 6 .3 f >\n 

", 1 . 

010 

)； 


302 

printm("should 

see 

<-1.3 > 

<%- 6 . 1 f>\n 

", -1 

.26 

)； 


303 

printm("should 

see 

< -1 . 2 > 

<% 6 . 1 f>\n» 

, -1 

. 24 



304 

printf("should 

see 

<1.234567 〉 

<%f>\n" , 

1.234567 

)； 

305 

printfC should 

see 

<1> 

<% 1 . 0 f>\n" 

• 1.234567 

)； 


306 #end i f 

307 > 

308 

309 #endi f 


図 9.8 doprnt.c の続き：テスト•ルーチン 


にかわって呼びだされる サブルーチンに するべきである.いいかえれば， このル 
ーチン が適切な構造であるならば，次のようになっている. 

d 〇 _ i n t( ... , base ) 

■C 

/* case ’0 ’ の以前の内容がここにくる */ 
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9. Printf () の構造 


break ; 
break ; 
break; 
break : 


doprnt( 


case 1 d ’ 
case 'x' 
case ' b 1 
case 'o 1 


goto は，サブルーチンのようなマクロに対するよぶんなプログラムを加えない 
で，サブルーチン呼出しをしないようにすることができる. 

doprnt () の最後の部分は， DEBUG が# deifne されているときだけコンパイル 
されるテストルーチンである.このルーチンは図 9. 8に示されている.デバツグ 
用に，コンパイラと共に供給されている printf () を使用できるように，261行目 
にある printm () を使用する.筆者はいつもライブラリに含まれる予定のファイ 
ルに小さなテストプログラムを入れる.このように独立したモジュールとしてそ 
のファイルをコンパイルすることによって， main () を含む第2のファイルをつ 
くってそれをリンクしなくても，ライブラリ.ルーチンをテストすることができ 
る. DEBUG が# define されていなければ， main () はコンパイルされずに， 
doprnt () がライブラリにリンクされる. 

9.7ltos() 

dopmt () を完全なものにするためには，あと2つのルーチンが必要である•そ 
れらは， long を ASCII 文字列に変換する ltos () と， double を文字列に変換する 
dtos () である. ltos () のプログラムを図 9.9 に示す. 

ltos () は3つの引数が渡される • n は変換される数， buf は変換された文字 
列がおかれるバッファへのポインタ， base は変換の基数である. base は，2進数 
への変換には2，8進数には8，10進数には10，16進数には16である.通常使 
わない基数（基数7のような）に変換するのにも ltos () を使用できる.しかし， 
基数の範囲は2から16である.基数10の数は負数でもよくて，この場合はマイ 
ナス符号を先頭につけて印刷される.その他の基数ではビット•パターンのよう 
にみえるので，負数として取り扱っても意味がない. 

引数 n は，符号つきの数にしてしまいがちだが ， unsigned long として宣目さ 
れている.この宣言が36行目のモジュロ演算の信頼性を高くする.しかし，〇よ 



t t t t 



0 0 0 0 
d d d d 
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「 *itos( n, buf, bas 

i g n e d long n 
r *buf 

base 


l | ng を文字列に変換する.16進，1〇進，8進，2進でプリントす 

“ n ” は変換される数. 

“ buf ” は出カバッファ. 

“ base ” は基数（16，10，8， 2). 

出力文字列はヌル記号で終わる.そのヌル終端記号へのポインタ 
がかえされる. 

数は，変換されながら，ひとつずつ配列に入れられる.配列には逆 
順に入れられる（例，/〇が最初で，もっとも右のけたがその次に 
入れられる）.リターンする前に場所を逆に入れ換える. 


reg 1 s ter char 
register int 
char 


*bp = buf ; 
minus = 0; 
*endp; 


if( base ==10 && (long)n < 0 
C 

m i n u s + + ; 
n = - ( ( l ong)n ); 


)/* 数が負数であり，か*/ 
/* つ基数が10ならば ， */ 
/* マイナスをつけて正 * / 
/* 数にする. * / 


*bp 
do { 


' ； /* 配列には逆順に入れられるか */ 

/* ら，今のうちにヌルを入れて */ 

/ * おく. * / 

++bp = H 0123456789abcdef" [ n % base ]; 

/= base; 


w h i l e ( n 


f f( minus ) 

* + + bp = • -•； 

for( endp = bp; bp > buf ;) 
C 

minus = *bp; 

*bp -- = *buf; 

*buf + + = minus; 


文字列を逆にする */ 

一時的な格納に */ 
minus を使用する.*/ 


return endp ; /* 終わりのヌルへのポインタをかえす 

図 9.9 itos . c — long の文字列への変換 


り小さいか調べるために26行目で通常の（符号つき） long に n をキャストしなけ 
ればならない . ltos () が呼びだされるとき （ long から unsigned long に）暗黙の型 
変換がある • long は符号つきでも符号なしでも同じ大きさだから，この暗黙の変 
換は望まない影響は及ぼさない. 

変換されたけたは逆順にバッファに入れられる（最も下の けた が最初である）. 
したがつて，最後の，/0,が，どの文字よりもさきに文字列に入れられる（ 3 2行目）. 


a s a t 
h n h n 
c u c i r\ 

— 乜 518190 だ 252627282930313233343536373839404142HH49505152> 
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変換が完了したとき，文字列全体の順序を逆にする （44 〜49行）. 

実際の変換はどこか变にみえるが，35〜39行の do ループで行われる.このプ 
ログラムは6章で詳しく説明されている•式 “0123456789 abcdef ”はひとつ 
の文字ポインタに評価され，， [] ，演算子をどの文字ボインタにも適用することが 
できる•式 u 0123456789 abcdef " [5] は文字，5,に評価される.ここで，6章で 
行われた簡単な AND 演算よりも，現在の基数によるモジュラわり算が行われる. 
( AND は2のべき乗である基数にだけ変換する）.モジュラわり算は演算数の一方 
が角数のときは予期しない結果になることがある.理由は n が unsigned で宣言さ 

れているからである.次の式 

x==((x/n)*n)+(x%n) 

はモジュラ演算では正しいはずであるが，当てにはできない. 


9.8 dtos() 

ltos ( ) に相当する浮動小数が使えるものが dtos ( ) である.これは， double を 
ASCII 変換する（図 9.10 参照） • dtos ( ) で行われる実際の変換作業の多くは， 
lto S ( ) で行われる.だから， dtos ( ) の主な機能は double を 2 つの long に，ひ 


1 

extern 

char 

* 1 tos ( 1 ong , 

c h a r ^ 

r , 1 nt ) ; 

2 

extern 

double 

floor (double 


) ; 

3 

extern 

double 

ceil (double 


) ; 

4 

5 

#de f 1 n e 

MAXPREC 

32 

/* 

10 進数の小数点の右側におくこと */ 

6 




/* 

のできるけたの最大数. */ 

7 




/* 

n の小数部分を求める. */ 

8 

#de fine 

FRACT(n) 

<( n )-( long )( n )) 

/* 

*/ 

9 

10 

11 

#define 

m i n ( a # b ) 

( (a) < (b) ?( 

a ) : 

(b) ) 

12 

/* - 





13 






14 

char 

★dtos( num # but # precisi 

i on ) 


15 

double 

num ; 




16 

char 

*buf ; 




17 

i n t 

precision ; 



18 

19 

て 

/* double を文字列に変換する. 

10 進数の変換だけをサポートする. 

20 


* num 

”は変換される数（正でなければならない）. 

21 


* “buf” 

は出カバッファ. 



22 


* “Drecision” は 10 進数の小数部分のけた数. ... . . 

23 


★ 

最大精度は32である.精度が0のときは，数の竪数部分だけか 

24 


it 

変換される. 



25 

26 


* 出力文字列はヌルで終わり， 

そのヌルへのボインタをかえす. 

27 


★ 




28 


★ 




29 


*/ 





(図9.10つづく） 
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char 

long 

precision 


tbuf[MAXPREC+1]; 

i ； 

*bp ; 
l num; 

in(precision,MAXPREC); 


必要ならば，精度を切り*/ 
捨てる. */ 


if ( 


0.0 


*bu f + + = • -| 
num = -num; 


/* 数を正に変換し，必要ならば， 
/* ’一 ’記号をプリントする. 


数 II 玆はぬ 1 は漂しのぬ Ilf 器^ 


bu f 


け ong ) num , buf,10 


if( precision 


縐 mxrui ば? d をるの 1 ^ 部分に 


=pre 
num 


10.C 


>=0 ; 


結，の数に適切に切り上げか，切り捨てを行う.それから， 

鹊す)るを"ばはきば f ののゼ数口のは前よね 


num = (FRACT(num) >= 0.50) ? ceil(num) : fLoor(num) 

1= Precision - ( ltos((long)num, tbuf,10) - tbuf) - 

/* 最後に小数点，先頭のゼロ，数の小数部分を八ッファに転送 

★ 

*/ 

for( *buf + + = '.' ；--1 >= 〇； *buf + + = • 〇 •) 

F 

for< bp = tbuf; *bp ; *buf++ = *bp++ ) 


*bu f = 〇 ； 
return( buf ); 


図 9 .10 dtos . c - double を文字列に変換する 


とつは数の整数部に，もうひとつは小数部に変換する.このやり方の問題点は， 
数の大きさが long の大きさに制限されることである.当然， l 0 n g の大きさは double 
より小さい.つまり32ヒットの long より，64ビットの double のほうがよリ大き 


;p38n4243“u47H”lp58H62H66676869707172737475767778798081828384858687s 
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な数を表すことができる.それで，大きな（または，小さな）値を持つ double が 
dtos ( ) によって小さくされる. 

double の整数部は dtos ( ) の 50 行目のキャストで取り出される. double を long 
にキャストするのは，小数を整数に変換することである.変換の一部として小数 
部が切り上げられる.整数部は 51 行目のひき算で削除される.このひき算の後， 
整数部はゼロに減らされて小数部はそのまま残される. 

n の 小数部は 53 〜 84 行の if 節で取り出される. 60, 61 行の for ループは，さき 
に取り出した小数に10を精度乗かける（精度は，小数点の右側におきたいビット 
の数である）.このかけ算は精度のけたを1〇進数の左シフト（小数点を右に移動） 
と同じ効果がある.興味の対象は，小数部から数の整数部に移っていった•今， 
残された小数部によってその整数を切り上げるか，きり下げるかしなければなら 
ない.これに失敗すると 1.0 のところを 0. 99999999 と印刷してしまったりする. 
この数を丸めるのは， 69 行目で行われている. 71 行目では 2 つのことを行ってい 
る.前と同じキャストと ltos ( ) の呼出しを使って，取りだした小数部を文字列 
に変換している.それと同時に，数を満たすのに必要なゼロの数に丨を初期化し 
ている（先行するゼロは ltos ( ) では印刷されないだろう）.最後に， 79 〜 83 行の 
for ループで， 小数点，先行する ゼロ， 変換された小数部を，もとの バツフ アにコ 
ピーす る. 


9.9 練 習 

9-1 dopmt () を使用して， sprintf () を書きなさい. sprintf () は，標準出力 
ではなく文字列に書きだす以外は， pnntf () のような動作を行う標準的な 
ライブラリルーチンである.例えば，呼出しは： 

char b u f[ 8 0 ] ; 

sprintf ( buf, "%d'_, n ); 

n を ASCII 文字列に変換して， buf にその文字列を入れる（スクリーン上に 
はださない）.解答が 15 行以上のプログラムになったら，何か重大な誤り 
がある. 

9-2 フィールドの幅を規定する精度部分の代わりに， * でも使えるように doprnU ノ 

を変更しなさい（現在，*は小数点の左にある*しかサポートしていない）. 
次の決まりも加えなさい- 
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習 


245 


9-3 

9-4 


%P _16 進でポインタの大きさのオブジェクトをブリントする 
% u - 符号 なし int を10進でプリントする. 

%x - 文字が大文字でプリントされる以外は ％ x と同じ 
%e - double をエンジニアリング表記でプリントする. 

[-] m . nnnE [+ 丨 一] xx の形を使用する.ここで， n の文 
字列の長さは精度で規定されており（ディフォルトは 6) 
m は 必ず 1けたである. 


整数部の値が long で表される double だけではなく， double の値でも印刷で 
きるように dopmt () を変更しなさい. 

入力関数 SCan f () を書きなさい.その関数を規定するのに読者のコンパ イ 
ラのドキュメンテーシヨンを使用しなさい.次の変換 ％ d %〇 % x 

%f % s だけはサポートする必要が ある. * が％に続くときは，入力列か 
ら該当するオブジェクトを取リ除き，それをどこにも入れないよう にす ベ 
きである. 















10 デバッギング 


本章ではたいへんありふれたデバッダの問題と， c プログラムでのプログラミ 
ング •エラーを 調べる.そして問題と解決の両方を示す.問題の中には，この本 
の他の章でもっと詳しく扱っているものもあるが，デバッグの問題をすべて1箇 
所に集めるために，本章でも再度述べている. 

スタックに関係する問題と，ポインタに関係する問題は ここでは 述べてい ない . 
それらは4, 6, 7章で詳述している. 

10.1 デバッグのための printf( ) の使用 

たぶん，読者の思い通りになる，もっとも強力なデバッグの手段は pr i n tf () 
である.プログラムが適切に動かないときには，プログラムの疑わしい ところに 
重要な変数の現在の内容や，ループの繰返しの数等がわかるように， P rintf () 
をたくさん書いておくとよい.通常は， adb や symdeb のようなデバッガを使う 
よりも， printf () 文を挿人するほうが時間がかからない.構造化した方法 （5 章 
をみよ）でプログラムを 開発 中ならば， 診断 機能を加える前に問題となる位置に 
ついてはすでに考えられているはずである. 

デバッグに使う pr intf () 文には，デバッグされるサブルーチンの名前や pr i nt f 
() 文がおかれたプログラムの場所を識別できるものを含ませる必要が ある. 例 
えば 

pn ntf("In oz( ), before wh i le(away.the.hours ) : x = %d\n", x、- 

とする. 

it define の仕組みは，デバッグ文をプログラム中に入れておきたいが，使わな 




248 


10 .デバッギング 


いときにはそれらは動作しないようにするときに使うことができる（筆者はデバ 
ッグ診断は，再びそれを使用する5分前まで消さないようにしている）.一れを行 
う2つの方法が図10.1に示されている. 


#i fdef DEBUG 

//define DIAG(x,y) f p r i n t f ( s t de r r , x, y )； 

//define D(x) x 

#e l se 

//define DIAG(x,y) 

# d e f i n e D ( x ) 

#end i f 

fredC) 

DIAGC'This is only be printed if DEBUG is #defined\n" # 0 )； 
DIAG("fred(): At top of program, x = %d\n", x 〉； 

D( printfC'This will go away when DEBUG isn't #defined\n "))； 

f or (i =： 0;l < i t_shou l d_be ; i ++ ) 

DIAG("fred( ): Doing iteration %d of for lo o p\n", i ) 

> 

> 

図 10 .1 診断を削除する 2 つの方法 


DIAG は DEBUG が# define されていれば， printf( ) に展開される.そうで 
なければ，空の文字列になり，引数は無視される. DIAG を使うとプロクラム 
中に# ifdef DEBUG 文を人れて得られるプログラムはきれいになつている. DI 
AG はマクロだから，第 2 引数が使われていなくてもマクロには 2 つの引数を渡 
さなければならない.しかし，ダミーの第2引数をマクロに渡すこともできる 
(さきの例の0である）. 

図 10.1 に示されている第 2 の方法はヌル•マクロ D である. DEBUG が# de¬ 
fine されているとき， D は引数を，この場合は printf( ) 文を展開する•前に 
も述べたように， DEBUG が# define されていないならば， D は展開されない. 

D マクロには 2, 3 のただし書きがある.プリプロセッサの中には，これをまつ 
たく受け入れないものもある.それで必ずしも移 t 直性はない.同様に，プリプロ 
セッサには， D への引数の中にコンマがあると混乱してしまうものもある.コ 
ンマには特に注意しなければいけない.最後に，セミコロンの場所も問題を起こ 
す.例をあげて説明する.プログラム 

if( (2 * b) || ! two_b ) *•、"、•、 

D( printfC'That is the questlon\n"),) 


else 






10.1デバッグのための printf () の使用 
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printfC'sl ings and arrows\n"); 

は， DEBUG が# define されていなければ，次のように展開する. 

if( ( 2 * b) II ! two_b ) 
else 

printfC^slings and arrows\n"); 

これは c の文法にかなっていない. 

別のデバッグの手段は，サブルーチンが自分のリターン•アドレスを印刷する 
ことである.サブルーチンが，呼ばれたアドレスとリンカがっくった非静的なサ 
ブルーチンのべース•アドレスの表とを比べて，サブルーチンの実行を追跡する 
ことができる.これはスタック.オーバーフローに関係する問題を解析しようと 
しているときには特に役立っ.その手順は 9.1 節に説明されている. 

printf( ) を使った診断の共通の問題は，プログラムの通常の出力と診断の出力 
が予想できない形で入り混じってしまうことである.これは通常の出力が stdout 
に向けられていて，診断のエラー出力も stdout に向いているときには特に問題で 
ある. 

MS-DOS と UNIX の出力機構は，この 2 っの出力の流れを完全に別の出カデ 
バイスとして扱う.したがって，その2っの出力の流れは，必ずしもプログラム 
からその行が出力されるのと同じ順序でスクリーンにはプリントされない.っま 


printf ( "F i r s t \ n » ) ； 

fprlntf( stderr, "Second\n ")； 

は，スクリーン上では 


Second 

First 

のようにプリントされることもある•行は入れ換わっているけれども，行の中で 
文字が混ざることはない. 

フログラムの中からこの問題を避ける方法は ， f p r i n tf () を呼びだした後で每 
回 fflush ( stderr ) か flush ( stdout ) を呼びだすことである.その他の解法方 
法もある.すべての出力をプリンタに記録し （ SHIFT - PrtSc かまたは P を使 
う），そのとき標準出力を切りかえる （ f 00 > ou tfil e を使う）ことである.標準 
エラーに送られたテキストは，スクリーンにもプリンタにもプリントさわ標準 
出力に送られたテキストは，全部指定されたファイルに入るだろう. MS-DOS 
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け標準 ェラーと 標準出力両方の出カス トリー ムの出力装置を，切りかえ可目巨な 
標準 コマンド•インタプリタ command . com に相当する UNIX のようなシェル 
があるが，標準 ェラーと 標準出力両方の装置の切りかえはできない（参考文献参 
照）. 

UNIX では， プログラム>&ファイルは 標準 エラーと 標準出力の両方を ファ 
イルに 切りかえるのに使われる. UNIX システムでは， stderr と stdout の両方 
がスクリーンに送られるときは，その2つを再構成できない.しかし，その2つ 
の出力の流れは装置切りかえをするために〉&を使うと混ざり合ってしまう（筆 
者が使用したシステムでは，全部の標準出力がまとめて ファイルに 送られて，標 
準 エラー 出力がその後に続いていた）.次のコマンドを使って，標準 エラー と標準 
出力を別々の ファイルに 人れることもできる. 

( プログラム〉ファイル1 ) >&ファイル2 

stdout に送られたすべてのメッセージはファイル 1 に入れられ， stderr に送ら 
れたメッセージはファイル2に入れられる • 

10. 2 コメントは入れ子にしない 

コメントは入れ子にできない•つまり，コメントの内側にコメントを書くこと 
はできない（図10.2をみよ）. 


/* 

I 

I 

コメントの 始まり. 


text */ 

I 

I 

コメントの終わり. 


I 

コメント開始記号 
と合わないからェ 
ラーになる. 


コメントの一■部とみ 

なされ無視される. コン ハ。イラはこれを コン 

パイル使用とするが，た 
ぶんエラーを生成する. 


図10 . 2コメントは人れ子にできない 


入れ子になったコメントは，いくつか問題を起こす.簡単にみつけることがで 
きる問題は，コメントにしたつもりのテキストをコンパイラが処理しようとして 
出す エラ— •メ ッセージで ある •プロ グラム中でコメントを含んだ部分の外側に 
コメントをつける必要があるときは， # ifdef 文を使い，それに関係のあるマクロ 








10.2コメントは人れ子にしない 


251 


名を決して# define しないようにする. 

例えば，次のようにする. 

#1 f d e f NEVER 

/* NEVER が前に # define されていなければ， 

★ この部分のプログラムはコンパイルされ ない 

*/ 

# e n d 1 f 

NEVER は絶対に # define しない.そして， # ifdef は入れ子にすることができ 

る. 


#ifdef EMMA 

/* EMMA が# define されているときだけ 

* コンパイルされる. 


#ifdef WOODHOUSE 

/* EMMA と WOODHOUSE が# define されているときだけ 

* コンパイルされる. 

*/ 

#endif 

/* EMMA が# define されているときだけ 

* コンパイルされる. 

*/ 

# e n d i f 

発見しにくいのは， コメント の終わり がない ために， コンパイルできないコ_ 
ドである. 

/* きちんと閉じていないコメント 
である.次の while ループはコメン 
卜の一部になっている./ 

w h 1 Ie( condition ) 
a c 1 1 on(); 

/* ここは別のコメントである. 

コメントの始まりは無視されるが， 

コメントの終わりは無視されない.*/ 

は， エラ _ •メッセージを 生成せ ず， while ループをコンパイルしない. 

この問題のもっともよ い 解決法は， コメント の終わりの記号をみ つけやすいよ 
うにプログラムを書くことである•すなわち， コメントは 必ず次の2 つ のうちの 
どちらかの方法で書くことである. 

/* アスタリスクの列をみていくと 

* コメントの終わりをみつけるこ 

* とができる. 


/* コメントの始まりと終わりの記号が 
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/* それぞれきちんと縦に並んでいるので， 
/* それらをみつけるのは簡単である. 


10. 3 lvalue required 

もっともよく起こるエラー.メッセージのひとつだが，理解するのがたいへん 
難しいのは ， lvalue required である.問題をもっとわかりやすくするために， 
lvalue の定義から始める.力ーニハンとリッチーの lvalue の定義を次に不す. 
オブジェクトは，メモリの操作単位である. lvalue は，オブジェクトを参照 
する式である. lvalue のわかりやすい例は識別子である. lvalue を生み出す 
演算子がある.例えば， E がポインタ型の式であるならば， * E は E がさし 
示すオブジェクトを参照する lvalue 式である. lvalue という名前は代入丸 
El = E 2 に由来する.この式で左 ( left ) の被演算数 El が lvalue 式であ 
る（注 1). 

lvalue は，式の計算結果が格納される場所である (Pooh ( Pooh，Winnie der ) 
が，’物を入れる大事なポット”といったように）.つまり lvalue は，アドレス，計 
算結果が格納される場所である. lvalue は実在する場所一どこかで宣言されてい 
る変数か，またはボインタがさし示している場所一でなければならない. 

lvalue を完全にする概念は， rvalue である. rvalue は lvalue の値を表す.つま 
り lvalue が計算結果をおくアドレスであるならば， rvalue はその結果自体である. 
その数が lvalue に入れられる.もっと正確には， rvalue は名なしの 一■時的な変数 
であり，式計算の間に計算結果を一時的に保持するために使用される.この一時 
的な変数は宣言しないから，直接にアクセスすることはできない. 

x = (y * z) ; 

では （y * z ) の結果が，コンパイラによって無名の 一■時変数に入れられる • 一 
の一時的な rvalue の内容は ， lvalue x にコピーされる. 
x = y ; 

では， y の内容が名なしの一時変数にコピーされ，その一時変数が x にコピーさ 
れるから， y が rvalue である.この動作はコンパイラに予定していた 以上の仕事 
をさせるという副作用がある.たいていのコンパイラは，この余計なコピーを除 


注1: B . 力ーニハンと D •リツナー， 

Hall ， 1978)， p .183. 


C ブロ グラミング言語 (Englewood Cliffs , N . J . - Prentice - 
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pointer->field = 5 
一 pointer + offset)->field = 5 
-pointer + +)-> field = 5 


*pointer = 5 

★(pointer + offset) = 5; 

*(pointer++) = 5; 

etc. 

HI 10 • 3 lvalue になる式 


x = 5 

a r r a y [ i ] = 5 
a r r a y [ i + j ] = 5 
etc. 

structure.field = 5 


識別子： 

完全な配列の参照： 

構造体のメンバの参照： 
間接的なメンバの参照： 

さし示されるオブジェクト: 


たくさんの構造体が lvalue を生成する.これを図10.3に示す.ポインタかォ 
フセット計算の一部でなければ，すべての演算子は lvalue でなく rvalue を生成 
する.そして，その rvalue は lvalue にコピーされなければならない. 

x++ = 5; 

で ， x + + は rvalue (インクリメントされる前の x の値を含む）をつくるけれど 
も，この rvalue は lvalue に格納されないので ，，’ lvalue required ” エラー•メッ 
セージを生成する（注 2). —方 

*++ptr = 5; 

は，+ +が rvalue を生成するけれども * が rvalue を lvalue に移しかえすから誤 
リではない. 

たぶんこの理由は，次の2つの文にコンパイラが行うことを調べてみるとも っ 
とよくわかるだろう.たいていのコンパイラは 

char * p t r ; 

* + + ptr = ' a'; 

注 2 :演算子 + + と-は状況によつて， lvalue か rvalue を生成することがまれにある. 


く.しかし， y はやはリ rvalue である. 

rvalue の生命は短い.式の計算が終了すると消されてしまう. いつもではな い 
が， rvalue の内容は式計算の終わりで lvalue に コピーされ なければならない.し 
ばらく，この規則の例外を調べてみる. 



t s s t 
s ( ( e 
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を次のように処理する. 

( 1 ) ptr の内容を取りだして，それを一時変数に入れる. 

( 2 ) その一時変数をインクリメントして，結果を ptr に入れる • 

( 3 ) その一時変数に含まれているアドレスに a を入れる. 

この3つの動作は一時変数を含んでおり，ステップ1と2で使用された一時変数 
は rvalue だが（値を含むから），ステップ 3 で使用されている一時変数は lvalue 
である（アドレスを保持し，そのアドレスは計算が終わる前に使用されるから）. 
ステップ1は，一時変数を初期化する.ステップ2は，一時変数を更新して他に 
コピーす る.ステップ3はポインタ ( lvalue ) としてその 一時 変数を使用する. 
誤った文 


i n t x ; 

++x = 'a'; 

はさきに示したものと同様な処理を行う. 

( 1 ) X の内容を取りだして，それを一時変数に入れる- 

(2) その一時変数をインクリメントして，結果を x に入れる. 

( 3 ) 別の一時変数に a を入れる. 

しかし，ステップ3で入れられた一時変数は決して使用されない.結局 a は， 
(1)， （2) とは関係ない一時変数以外のどこにも格納されない.これが，この場 
合に コンパイラが” lvalue required ” の エラー. メッセージをだす理由である. 
もうひとつ問題がある•式 

x = - - ( y - z ) ; 

もまた誤りである.これは rvalue[(y — z )] が変更されているが，その値は格 

納されるので間違いではないように思える.残念ながら，演算子-は rvalue で 

はなく， lvalue に適用されなければならない.この問題は”左手が何をしている 
のか右手は知らない”というようなことである- y — z を計算するプログラムを生 
成す るコ ン パイ ラの部分は結果を一時変数におくが， -- を行うプログラムを生 
成す るコ ン パイ ラの部分はその一時変数がどこにあるのかわからない.いいかえ 
れば—— の 処理 ルー チンは何をデクリメントするのかプログラマが正確に指示 
すると思っている.しかし，一時変数がどこにあるのかプログラマにはわからな 
いから， _ — の処理部分に教えることはできない. 

どの演算子が lvalue を必要とし，どの演算子が rvalue を必要とするのかどう 
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したらわかるだろうか？これは， コンパイラで 使う文法 （カーニハンと リッチ 
一の本の後にある文法な ど） を調べればよい. lvalue と呼ばれる非終端記号があ 
る.これが8章で文法を詳しく調べた理由のひとつである.読者が文法を必要と 
するときに，それを使用できるように調べておいたのである. 


10.4 演算子に関連した エラー 


10. 4. 1優先順位の エラー 


演算子の優先順位には気をつける必要がある.筆者はよく C の優先順位図をコ 
ピーして，それを使いそうな コンピュー タの横にかけて いる. 6章でみたように， 
* ++ P はポインタをインクリメントし， 一方 + + * p は， p にさし示されて いる 
オブジェクトをインクリメントする. 

他の演算子，特に代入演算子はさらに油断できない.例えば 


は 


while( c = get char( ) != EOF ) 

something( c ); 


while( c = (get char( ) != EOF)) 

something( c ); 

と評価される.つまリ， c は getchar () からもどされたのが EOF でなければ， 

その値は代入された1である. EOF だったら〇である. g etchar () からかえさ 

れた文字はなくなってしまう.この問題は次のようにかっこをつけて解決できる. 

while( (c = get char( )) != EOF ) 

someth ing( c ); 

もつと険悪な のが + = 演算子と その仲間である.次のようにすることはょくぁ 
る. 


wh 1 Ie( 1 ++ < 1 〇 ) 

do_somethina () ； 

ここで，1ではなく 2を加えたかったらどうすればよいだろうか？次のよう 
にしてしまいがちである. 


Wh 1 I e( i += 2 < 1 〇 ) 

do_something ()； 

しかし，優先順位図では += より < の方が優先度が高い.したがって，この式 
にかっこをつけて表すと 

wh 1 I e( i += (2 < 1 〇 ) ) 

do_something() : 
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である • 2が10より大きければ， i に1が加えられる.そうでなければ〇が加え 
られる. 2は10より小さいから， i は必ずインクリメントされる.このループは 
意図していた回数の2倍実行される•これもまた正しくかっこをつければ解決で 
きる. 

while( (i += 2) < 10)) 

do_something(); 

ここでの教訓は注意することである.十二は問題を起こしそうだから使うべき 
ではないと考えてはいけない.ただ，使うときによく注意すればよい. 

また別の問題がある.次の式を考えてみよう. 

x = a - b ; 

は1行に5つのマイナス記号を持っている.かっこをつけるとどうなるだろうか？ 

いくつかの場合が考えられる. 

x = ( a — ) - ( — b ) ; 

x = ( a-- ) - ( -b ) ； 

x = a - ( ( — b )); 

もちろん，最初の文だけが構文として正しい.しかし，演算子が一か —— かの決 
定 は，簡単に実現可能な方法でコンパイラの初期段階（字句解析プログラム）に 
て行われる.この字句解析プログラムは， c の構文については何も知らない•意 
味のあるものが集まるまで，入力から文字を集めるだけである.コンパイラは， 
たぶん この 3つのうちの中央のものを選び， エラー •メッセージをだすだろ つ. 

10. 4. 2 評価順序のエラー 

r 含§§ ではたいていの プログラミング言語にあることと同様に，同じ優先度を 
持つ2つの演算子を評価する順序は決まっていない（注 3 ).これは通常，問題は 
ない.例えば 

x = _-y + --z ; 

とするとき， y と z をたす前に両方ともデクリメントしている限り， y をさきに 
デクリメントしても Z がさきでも問題はない•式 

1 n t a = 4 ; 

x = -_a - --a; 

注 3 :この規則の例外は，演算子 I 丨と&&である.それは左から右に評価する.評価は左が真か偽か 
決定されるとき，確実に終了する. 
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はまた別の問題である.これは言語としては正しい式であるが，た いていのコン 
パイラは， エラー•メッセージを だす.しかし，左の a がさきにデクリメントさ 
れると，式は 

x = 3 - 2; 

すなわち1に計算される.もし右の a がさきにデクリメントされ ていたら， 式は 

x = 2 - 3; 

すなわち_1と計算される. a はひき算の前に2回デクリメントされる.でも， 
どちらの a がさきにデクリメントされるかわからない. 

式の結合や優先度の順序と，評価の順序を混同してはいけない.結合と優先度 
は，どの演算子が特定の変数と関係するのか，どのようにみえないかっこを挿入 
するのかを決定する.評価の順序は，入れ子になって いるかっ この同じ レベルに 
ある式が評価される順序である. 

評価の順序は，サブルーチンの呼出しにも問題を起こす.サブルーチンの引 
数が評価される順序は決まっていない.次の呼出し 

a = 4; 

f 〇〇 ( a, a + + ); 

には，以刖と同様の問題がみられる.左の a がさきに評価されると， foo () は 
foo (4,4) で呼びだされる.右の a がさきに評価されると， f 00 (5,4) で呼びださ 
れる.同様に，呼出し 

Sit( spot( ), f 1 d 〇 ()); 

では spot () と fido () のどちらがさきに呼びだされるかわからない.もし2つ 
のサブルーチンがグローバル変数を通して対話したら，ここに問題が起こりうる 
(ところで，この問題が，できるだけグローバル変数の使用を避けるもうひとつ 
の理由である）. 

最後の評価順序の問題は，たし算の演算子である.コンパイラには，たし算は 
交換法則と結合法則がなり立つ，と仮定しているものがある.したがって，その 
ようなコンパイラは，+演算子だけを使った式中のかっこは無視する.例えば 

z=(a+b)+(c+d) 

は，たとえ式にかっこがあったとしても 

z=a+(b+c)+d 

として扱われるかもしれない.評価の順序を確実にするには次のようにしなけれ 
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ばならない. 

x = a + b ; 

y = C + d ； 

z = X + y ； 

これは通常は問題にならないが，も b ， c ， d がサブルーチン呼出しであれば問題 
になる. 

10. 4. 3 誤つた演算子の使用 

みてすぐわかる問題は，二と==，&と&&などの混同である•本当は 

w h i L e ( x = = y ) 


とするのには注意すべきである. 

後者は y の内容に評価され，前者は X と y が等しいかどうかによつて，1か0に 
評価される.発見することが難しい演算子に関係した問題もある•例えば c 言語 
では，文 


だけでもまったく問題はない.それは何の役にもたたないが，多くのコンパづフ 
はこれをみつけても警告メッセージさえださないたろう.これは次のように書く 
つもりだったのならば問題になる. 

X += y ; 

同様に 

x >>= y ; 

とするつもりが 

x >= y ; 

となっていても，多くのコンパイラは受け入れる.後の文は何もしない，一方さ 
きの文は y ビット x を右にシフトする. 

ところで，ときおり 


if( x ) 

y + +; 


の代わりに使用されている 


x && y++ ; 
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のよつな文をみかける.どちらの文も， x がゼロであれば y はインクリメントさ 

れない.しかし後者は読みにくいので避けるべきである.同様に， for 文以外の 

ところでコンマ演算子を使用するのは避けるべきである.かっこを書く の が都合 

の悪いマクロ定義以外のところで 

1 f( condition ) 

て 

x + + ； 

y ++; 

> 

の代わりに 


1 f( condition ) 

x ++, y ++ ； 


を使用すべきではない. 


10.5 制御のながれ 

10.5.1 不必要なヌル文，どこにも所属しない| } 

C gg 吾では，セミコロンは文の分離記号 （ Pascal にあるように）ではなく，文 
の終了記号である.実際には，セミコロンだけでも言語では正しい文である こと 
を意味する.この文を，何もしないので，ヌル文（空文）と呼ぶ . for ループの 
本体がないとき等，ときには有効である.例を図10.4に示す. 


strIen( s tr ) 
char *s t r ; 

register char *p; 

for( p = str; *p ； p++ ) 

# 

^ return( p - str ); 

図 10 • 4 空の本体を 持つ for ループ 


多くはないが，ヌル文があるとバグになることがある•例えば 

wh 1 Ie( condition ) ; 

--cond 1 1 ion ; 

は， ’’ condition がゼロでない間は何もせず （ while にヌル文が続いているから）， 
その後 condition はデクリメントされる’’といっている. しか i ループは 決， 
て終わらない.同じことが if 文にも起こりうる. 


/* バイトで文字列の */ 
/* 長さをかえす * / 


/* 文字列の終わりに*/ 
/* p をすすめる */ 
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1 f( condition ) ; 

thing-1 ()； 

else 

thing-2 ()； 

ここでは，コンパイラが次のようにプログラムを並びかえる. 

1 f( condition ) 

; /* 何もしない*/ 

thing_1 () ； 
else 

thing_2(); 

は，” condition が真ならば何もしない，そして thing _ l () を行う”.コンパイラ 
が else 節を処理しようとするとき，前にあるはずの if がみつけられなくて，エ 
ラ ー•メッセージをだす. 

if の後に’丨丨，をおいても，セミコロンがその前にあるときは役にたたない. 

| |は while ， for ， if 等に接していなければならない.例えば，次の記述は正し 


whiL e( condition ) 

C 

do_something(); 

> 

> 


かっこをこのように使用する理由は， サブルーチンの 本体内（先頭ではなく） 
で官言される変数の範囲を制限するためである•例 


= 1； <-この” i ” は下の” i ” とは違う変数 

である. 

I 

n t i ； -- 

or( i = MAXVAL ;--1 >= 〇 ； ) 
a c t i 〇 n () ; 

ここで， 2 番目の i は内側の I 1 内だけに存在する.それは最初の i とは物理的 
に異なり，宣言されたときからスタックフレームに加えられ， I があつたとき削 
除される. この 状況は， グローバル 変数と ローカル 変数が同じ名前であるときの 
状肯 肖と同じである. 口ーカル 変数が サブルーチンの 内側で使用される.しかし， 
同名の グロ ーバル 変数を サブルーチンの 内側から直接取りだす方法はない. 


al 

i 


c e ( 


int 
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一時変数をつくらなくてはならないとき，すでに存在する変数と同じ名前にな 
る V _ とを心配したくないならば，次の少しかわった方法が， マクロでは 役にたつ. 
例 

#define SWAP—I NT(a , b) { i nt temp; temp=(a); (a) = (b ) ; (b) = temp;> 

は， a と b の内容を交換する•変数 temp は，マクロの丨|にはさまれた部分が 
実行されている間だけ存在する.そのサブルーチン内の他の変数が， temp とい 
う名刖でも問題はない.マクロの丨丨の内側の temp は異なる変数である. 

10.5.2 誤った if/else の結合 

else 文はいつも前にあるもっとも近い if と関係する.例えば，次は誤りでぁ 

る. 


1 f( condition ) 

1 f ( condition ) 
a c t i o n ( 

else < - 

a c t i o n ()； 


)； 


間違い 


■では，為ったインァントに不されるのとは違って， else は最初の if ではな 
く，2番目の if と関係する.この問題は，次のように if / e l se が続 いてい ると き 
によくみかける. 


1 f (. 

• •) 



act 

lon ( 

else 

i f ( _ . 

.) 


act 

i on ( 

else 

l f (.. 

.) 


act 

lon ( 


考えもせずに else 節の中に2番目の if 文をおくと，全部まちがった結合にな 
つてゆく，このような理由で， if / else を連続させるときは j } を使うべきであ 
る. 


> 

else 


> 

else 


a c t i 〇 n ( 


a c 1 1 on( 
i f (...) 


)； 


> 


a c t i o n (); 
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10. 6 マクロ 

10. 6. 1マクロの優先順位の問題 

たいていのコンハ。 イラでは，十分に かっ こ付けがされて いる 定数式に対しては 
コン パイル時に計算が正しく行われて いる. 例えば 

x =1 * (1024 * 6); 

は，コンパイル 時に 1024 * 6 が計算され，命令 コー ドは最初から x = i * 6144 
だったように生成されるだろう•もしそのかっこが式に含まれていなかったら， 
コンパイル 時の計算は通常保証されない.この場合 コンパイラが， かけ算演算子 
の左から右への結合性に基づいて，みえないかっこを挿入する.つまり 

1 * 1024 * 6 

はコンパイラ によ って次の よ うにかっこ 付けされる. 

((i * 1024) * 6) 

なぜなら， * は左から右に結合性があるからである.そのとき，コンパイラは， 

，’ 式に変数が含まれているので （i * 1024) を コンパイル 時に計算できない.だか 
ら， （（ i* 1 024) * 6) も コンパイル 時には計算できない•なぜなら副式 （i * 
1024) に変数が含まれているから，，と 一人 ごとをいうかもしれない. マクロの 内 
側の組み合わさっている定数を# define するとき，かっこをつける必要がある • 
//define ARRAY-SIZE ( 1024 * 6) 

これはコンパイラに依存しているから，たとえ読者のコンハ。イラが正しく計算 
を行っても，移植性のためにはかっこをつけた方がよい. 

マクロの展開で起きるもう少し小さな問題もある • ドを計算するマクロ 

//define S Q U A R E ( i ) i * i 

を考えてみよ.このマクロは 

x = SQUARE(a + b) ; 

で呼びだされるとき 

x=a+b*a+b; 

に展開される. * は+より優先度が高いから，コンハ。イラは式を 

x=a+(b*a)+b; 

として計算する.これは期待していたものではない • 

プリプロセッサは C 言語を知らない•プリプロセッサは，テキストの置き換え 
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をするだけである.プリプロセッサは，プログラマがマクロにある引数をどの 
ように計算するのかわからない.指示されたテキストを置き換えるだけである. 
SQUARE マクロでの問題は，次のように意図的に式にかっこをつけて SQUARE 
を# define することで解決できる. 

#define SQUARE ( i ) ( ( i ) * ⑴） 

これで前の例は 


x = ((a + b) * (a + b)) ; 

に展開される.これらの問題を避けるには，マクロ内のすべての式に十分にかっ 
こをつけて，マクロの引数もかっこで囲むことである. 


10.6.2 期待に反するマクロ引数の置換え 

多くの C プログラマは，マクロが引用符 （”） で囲まれた文字列は展開されな 
いことを知っている.例えば 

# d e f 1 n e F 00 xxxx 


printf("FOO"); 

では， FOO がプリントされて， xxxx はプリントされない.多くの C プログラマ 
はたいていのコンパイラがマクロ定義の一部である引用符で囲まれた文字列にマ 
クロ引数を展開することを知らない.例えば 


#define HELLO(name) printf(" HeL lo n a m e \ n '•); 

のとき，呼出し 


は 


H E L L0( Jean ); 


printfC' Hello J e a n \ n "); 

に展開される.これは次のようなマクロでは問題を起こすことがある. 


#define PRINT(s) p rin t f( M % s" , s)_ 

! i i 

i i i 

この引数に対応する文字列は | 

ここで展開され I 

ここでも展開される. 

この文字列内の展開は，ときには役にたつことがある.例えば 

PRINT_NUM(name,radix) fpr i nt f(stderr, "name = % r a dix\n" 

のとき 
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PRINT _ NUM ( sarah , x ) / * 16進でプリントする */ 

PRINT _ NUM(bi U , d ) /* 10進でプリントする */ 

で呼びだされたとき， PRINT - NUM は次のように展開される. 

fprintf ( stderr , "sarah = % x \ n ", sarah ); 
fprintf ( stderr , "bill = % d \ n ", bill ); 


10.6.3 マクロの副作用 

マクロは，予期しない方法で変数を変更することがある.マクロ max ( x ， y ) を 
考えてみよう.これは x か y のどちらが大きいかによつて評価する. 

//define max(x,y) ((x) > (y) ? (x) : (y)) 


このマクロが 


max( *ptr++, MAXNUM ); 


で呼びだされるとき，次のように展開される. 

y = ((*ptr++) > (MAXNUM) ? (*ptr++) : (MAXNUM)) 

* ptr が MAXNUM より大きければ， ptr は2回インクリメントされる （*ptr 
が， MAXNUM より小さいか同じときには1回だけインクリメントされる）•こ 
のような動作を副作用と呼ぶ.残念ながら， ctype . h にあるマクロ （ isupper ， 
toupper ， isdigit ) の多くは虽11作用が起こることがある.それらには注思する必要 
がある（注 4). 


10. 716 ビットではない int 
10. 7.1 精 度 

int , あるいはその他の型が特別な大きさであることを確かめることはできない. 
筆者はいままで16ビットより少ないビットで表されている int をみたことがな 
い.しかし 16 ビットと32ビットの int はよくみる.これは機械的な計算での 
考え方である. int が32ビットであると仮定すると，16ビットの計算機にプログ 
ラムを移植しょうとするとき，数を切り捨てなければならない.精度が32ビッ 
卜必要ならば， int ではなく long に変数を入れる （ int の大きさを計算するサブル 
ー チンが図5.13に与えられている）. 


注4 :審議中の ANSI 規格の C 言語は，標準ライブラリのマクロ （ ctype . h 等）の波及効果を禁じて 
いる.しかし，波及効果がないとは思えない. 
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10. 7.2 マクロでの不完全な文 

マクロに関係する最後の 問題は， if 文を含んで いるマクロである. 例えば 

"define ERR(e,s) i f(e) printf(s) 


if( condition ) 

ERR( e, "error") 

else 


printf("something 


else 11 


は期待どおりには動かない. else 文は前にあるもっとも近い if と結びつく.こ 
の 場合 その if は ERR マクロの一 部である.上のプログラムは，誤って 次のょぅ 
に展開される. 


if ( 


condition ) 


1 f ( e 
else 


pr i nt f( "error ")； 
printf("something else"); 


-の問題は，前に問題にしたヌル文を利用して解決できる . C ではセミコロン 
たけでも正しい文である（何もしないが，誤りではない） • ERR マクロは次のよ 
う に参照される. 


"define ERR(e , s) 彳 f(e) printf(s); else 

これで if は 


E R R ( e , s ); 

で呼びだされるときに，セミコロンひとつが本体である e l se 節と関係する. 


10. 7. 3マスク 

int の大きさは，ワードの上位か下位の ビッ トを マスクす るときにも重要であ 
る.図10.5は，移植性のある形と移植性のない形で表した一般的な マスクの一 
部である.左の欄は，16ビットの int を使用していると仮定した マスク を示す 


移植性 

なし： 

Oxffff 
Oxfffe 
Oxfff 0 
0 x 7 fff 
0 x 8000 


移植性 

あ 1 ): X &= MASK : 

'? 全ビットを 1 にセット 

. 1 , 最右のビットをクリア 

. 」 下位4ビットをクリア 

(( unsigned )( 〇) »1)最上位のビットをクリア 
(( unsigned )(-0) » 1 )最上位ビット以外をクリア 

図 10.5 移植性のあるビット •マスク 


X 1= MASK : 

何もしない 
最右以外をセット 
下位4ビットをセット 
最上位以外をセット 
最上位をセット 










266 


10 .デバッギング 


中央の欄は， int の大きさについて何も仮定していない場合の等価な式である.右 
の欄は， AND と OR 演算でのマスクの機能を説明している.コンパイフによつ 
て異なるが，式は定数だけで構成されているから図 10 . 5 の複雑な式のすべては 
コンパイル時に評価されるべきである. 

10.7.4 定数は int である 

単純な定数は int 型である.これは，定数が非整数の引数を期待しているサフ 
ルーチンに 渡されるときには問題になる.次を考えてみよう. 


f 〇〇 ( X 

long 

i 

> 


x ； 


foo(10 )； 
foo(10L ); 


/* 誤 1 ) */ 

/ * 正しい * / 

ここで foo () への最初の呼出しは正しくない • 10 は int だから，コンパイ 
ラは スタックに int の大きさのオブジェクトとしてプッシュする.しかし， foo () 

は long の大きさのオブジェクトを期待している（この問題は 3 章でも討議した）. 
foo () への 2 番目の呼出しでは， 10 にしが続いているので，問題は解決する. 

L が続く定数は long 型である- 

同じょうな問題は，定数が長すぎても起こる.例えば， 16 ビットに含まれるこ 

とのできるもっとも大きな数は32767である. 

int x = 40000 ； 

とする こ とができるが， コ ンパイラはエラーをプリントしない.しかし，1〇進の 
40 000は16ビットの符号付き数では表せない（符号なしの16ビットでは表せ 
るけれども）. 40 000は 0 x 9 c 40 である.最上位ビットがセットされているかり， 
0 x 9 c 40 は負数 （10 進数一25536)である•式 x = 40 000は x を 一25 536に初 
期化する. 4000 0 L としても，代入するときやはり丸められるから役にはたたな 
い. この 問題を解決するたったひとつの方法は， x を unsigned か long で旦目す 

ることである. 

10.8 自動型変換の問題 

自動型変換は式が計算されるごとに起こる •特に， char はすべて int に変換さ 
れる.全部の： float が必ず long に変換される.したがって，式中の数はその中の 
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もっとも大きな型に変換される.例えば，式が int と i ong を含んでいるとすると， 
mt は使用される刖に long に変換される•式が long と double を含んでいると 
すると， long は使用される前に double に変換される.一方の非演算数が i nt でも 
つ一方が unsigned であれば， int は unsigned に変換される.変換は，式を評価 
しながら，ひとつまたは2つの演算数に同時に行われる. 

return 文は式を引数とするから， char の大きさの オ ブジェクトをかえ す、 と 
はできない. 自動 型変換は， return が実行される前に c h ar を i n t に変換する. 
同様に，サブルーチンへの引数はすべて式で ある. それで char や仙れけサ 
フルーチンが呼びだされる前に int や d ou bi e に変換されるから，渡すことはでき 
ない (注 5). 

式の一邰とせずに変数を使用することはできないから，型変換はすべての式で 
行われる.変数を char や int で格納してメモリを節約しない方がよい（メモリが 
本当にわずかしかなかったり，配列を使用しているのでなければ）.つまり ， char 
の配列には意味がある.たったひとつの C h ar には意味がない. i n t を使用すれば 
よい.メモリの節約は，プログラムが型変換を必要としているので錯覚を起こさ 
せる.数を int ではなく char で格納すると，データ領域のメモリを } バイ ト節約 
できるかもしれないが，同時に型変換のために 20 バイ トも使う. 2 つの doubIe 
をかけ合わせるよりも，2つの float をかけ合わせるほうが時間がかかる（なぜな 
ら float は使用される前に double に変換されるから）. 

自動型変換のために起こる問題が他にもある•ループ中の比較 

unsigned x ; 

for( x = VAL; x > -1；-_x ) 
a c t i o n ()； 

は々 x の値に関係なく， いつも 偽である.ここで—！（ビット .バタ-ンは 0x 圆 
は苻可なしの数のように扱われる.—エは int であるが， 自動型変換が unsigned 
にか足る. Oxffff は値65 535,16ビツトの unsigned int で表すことができるもっ 
とも大きい数，である . x はもっとも大きな数より大きくなることはできな いた 
めこの比較はつねに偽になる. 

32 ビツ トの long の 下位 16 ビッ ト 以外をすべてを クリァ する ために 


圧 5 .ひき 数を char であると 宣言す ることができる . しかし，これは通常効力はなぃ . 
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x &= 0 x f f f f ； 

を使う ことは できない • Ox 他は int で，しかも負数である（値は— 1). 叉は 
long だから，定数 Oxffff (- l ) は使用される前に1〇耶に雜される • 32 ビット 
の数に変換されるとき， -1 は値 Oxffff 他になる.したがって，上の式は次の 

ように扱われる. 

X &= Oxff ”””； 

式は何もしない.問題は OxffffL と書けば解決することができる¬ 
もう ひとつ型変換の問題がある •式は 2 つの項を同時に評価され， そしし，中 
間結果を2つの項と同じ型を持つ名なしの一時変数に入れる.さらに，自動型変 
換の規則が，この2つの項にも適用される.例えば 

1 nt a =1 〇 , b = 20 ； 

d = a * b ; 

十 a と b がかけ合わされ，結果は名なしの一時変数に入れられる • a と b は両 
方とも int だから，型蛮換は必要ない.一時変数の内容は d にコピーされる.今 
度も名な しの 一時変数と d は int であるから，型変換は必要ではない.式がもっ 
と讎であるとしたら，より多くの一時変数ができるか，その一時変数がより複 
雑な使われかたをするだろう • 

次の場合を考えてみよう • 

int a = 32767, b =10 ; 

Long d; 

d = a * b ; 

数 32 767 は 16 ビットで表すことができる. 327 670は表すことができなレ、.そ 
のため結果を1卿に入れることにする•しかし，名なしの一時変数の型は非演算 
数の型と同じだから，式は正しく計算されない-つまり， a と b は’とも血で 
あるから，型変換は行われない.：ンパイラは， a と b の内容が実行時にどつな 
るのかコンパイル時にはわからない.わかっていることは非演讎の型たけで 
ある.したがって，32767は10をかけられるだろうが，その結果除 t の大きさ 
の 一時変数には入らない • 327 670 (0 x 4 fff 6) は int には入らないから’ ~ 10(0xi 
ff 6) に切り下げられる.コンパイラは，この一時雛と d の型を調べる. d は 
long だから，型変換が一時変数に行われ（ 1〇 即に変換される）， — 10 が d に代入 
される. 
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問題は演算数の一方または両方に型変換をすることで解決できる.だから，名 
なしの一時変数の型もかわる.これはキャストで行う. 

d = (long)a * (long)b ; 

この例ではキャストはひとつだけ必要であるが，計算がすべて正しく行われる 
ことを確実にするために，複雑な式では全演算数にキャストを行うことはよい考 
えである. C では計算順序は保証されていないし，式を計算しながら型変換が行 
われることをおぼえておく必要がある. 

10.9 extern 文の欠如，または暗黙の extern 文 

その他の型に関係する問題は，外部サブルーチンの返り値である.コンハ。イラ 
は，サブルーチンの明示された宣言（実際のサブルーチンの定義か先行する ex ¬ 
tern 文） をみつけられなかったら，サブルーチンは int をかえすと仮定する. 

この仮定は，サブルーチンが宣言される前にファイル中で使用されたとき， 
問題が起こることがある.コンパイラは知らないサブルーチンをみつけると，シ 
ンボル•テーブルにそのル_チンを登録し，その返り値は int であると示す.コ 
ンパイラがその後で実際の定義をみつけ，その定義が int 以外のものをかえすこ 
とになっていたら，コンパイラは同じ名前を持っているが返り値が異なる2つの 
サブルーチンが宣言されていると思う. コンパイラは ” type mismatch ” （型が 
合わない）という エラ--. メッセージをだす. 

C はこの問題一 extern 記憶クラスーが起きないようにする手段を与えている. 
extern は実際には” external ” （外部の）の意味ではない.むしろ，変数（また 
はサブルーチン）名を特別な型を持つものとしてシンボルテ_ブルに入れるため 
の，コンパイラへの命令である.コンパイラは，リンカにその変数（またはサブ 
ルーチン）のメモリでの実際の場所（コンパイル時ではなく，実行時の）を探さ 
せる.いいかえれば， extern は宣言であって，定義ではない.変数宣言は，コン 
パイラにシンボル.テーブルに要素を入れるように教えるだけである.定義は実 
際に変数のメモリを確保させ，シンボル.テーブルへの登録も行う. 

サブルーチンの外部宣言は次の形をとる. 

Long john_si Lver( ) ; /* long をかえす */ 

char *capn_fl int( ) ; /* char へのポインタをかえす*/ 

double bi L Ly_bones( ) ; /* double をかえす * / 

筆者はたいてい extern 文を全部ファイルの先頭に集める. 
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extern 文の欠如のために起こるその他の問題は，返り値の切捨てである•ある 
サブルーチンが，実際には long かポインタをかえすが，コンパイラが int をかえ 
すと思っているとすると，返り値は使用される前に int の大きさにされる•この 
切捨てを防ぐために， int 以外の型をかえすように宣言された extern 文の，サブ 
ルーチンを最初に使用する前におく. 

extern 文の代わりにキャストを使用してはいけない.この禁止の理由は次のプ 
ログラムにある. 


char *ptr ; 

p t r = (char * ) malloc( ARRAY-SIZE ); 

malloc () の宣言が使用する前にない.ここでは， malloc () が int をかえ 
し（なぜなら， int 以外をかえすことを指示する extern 文がないから），そして 
かえされた int が使用される前に文字ポインタに変換されるべきであるとコンパ 
イラに教えている.ポインタが32ビットで， int が16ビットであれば，問題が 
生じる.コンパイラは， malloc () が int をかえすと思っているから， malloc () 
の返り値を16ビットに切り捨てる.それからコンパイラはキャストを処理し， 
切り捨てられた数を32ビットのポインタに変換する.しかし，その数には切捨 
てが行われたから，上位16ビットは失われている.ポインタへの変換は切り捨 
てられたビットを再格納しない.代わりに最上位バイトにゼロをうめる.とにか 
く，そのポインタは意味のあるものをさし示さない. 

サブルーチンが long をかえすとき 


long x ; 

extern Long f 〇〇 ()； 

x = f 〇〇 (); 


の代わりに 


long x ; 

x = (Iona) f 〇〇 ( ) ; / * f 〇〇 returns a Long * / 

を使おうとすると，同じ問題が起こる.また， extern 文がないので，コンパイラ 
は， foo () が int をかえすと仮定する. foo () からかえされた値の上位16ビッ 
卜は切り捨てられ，それから切り捨てられた数を long に変換する.ここでは，符 
号拡張が型変換の一部として行われる. foo () の返り値の上位16ビットが失わ 
れるだけでなく，その返り値は負数に変換されることもありうる（下位ワードの 
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最上位ビットが1であったならば）（注 6). 

10.10 I / 0 

10.10. 1 scanf () 

scanf () は，プログラムが別のプログラムにつくられた ファイルを 読む ので 
なければ使わない方がよい • scanf () は，人間と対話することは意図されてい 
ない. scanf () 変換機能を使わなければならないのなら， gets () か fgets () 
で文字列を入力し，それから sscanf () 関数をその文字列から必要な情報を取り 
出すために使用すべきである. 

scanf () は空白を無視し，改行（’ \ n ’） を空白にする.したがって，入カファ 
イルの1行につき3つの数が含まれているはずのところに，1行に2つの数しか 
ないとき， scanf () は次の行に3番目の数を取りにゆく.その行からファイル 
の終わりまで，正しい入力と同調させることはできない. 

scanf () の全引数はポインタでなければならない.アンハ。サンド （&) を忘 
れるとひどい結果になる. 

scanf("%x" , num ); 

ここで， scanf () は num の内容を渡され，それを数がおかれるべき場所への 
ポインタであるかのように取り扱う. num の値が0ならば ， scanf () は変換さ 
れた数をメモリ番地0に入れる.この例は次のようにするのが正しい. 

scanf("%x" , &num ) ; 

scanf () の呼出しと他の入力関数を混ぜて使うとき，特に， scanf () と gets 
() や fgets () をいっしょに使うときには注意する必要がある.次のプログラ 
ムを考えよ. 

1 n t num ; 

char buf[128]; 

scanf ( "%d" , &num ) ; /* 数を得る */ 

g e t s ( b u f ) ; /* 文字歹 lj を得る */ 

数，改行，文字列を続けて入力すると，次の動作が行われる. 

( 1 ) scanf () は空白をとばしながら，数字に合うまで，文字を読む. 

(2) scanf () は数を整数に変換しながら，数ではなくなる（改行）まで文字 

注 6 : 予約語 extern は，このような宣言では実際は任意であるが， extern を使用することは，よいプ 
ログラミングス タイ ルで ある . 
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を読む. 

(3) scanf () は数でなくなった文字を ungetc () を呼びだして入力列にもど 
し，それからリターンする. 

(4) gets () が呼びだされる. scanf () がもどした改行を読み，文字列の終 
わりとしてそれを扱い，すぐにリターンする. buf は最初で唯一の文字と 
して’ \ n ’ をひとつ含んでいる. 

この状態は 

gets( buf ) ; 

num = at 〇 1 (buf ); 

gets( buf ); 

か 

gets ( buf ); 
sscanf( buf, "%d", &num ); 
gets ( buf ); 

を使用して訂正することができる. 

10.10. 2 getc () はバッファを持った関数である 

getc () はバッファを持った入力関数である [ getchar () もバッファを持っ 
ているが， getc () を呼ぶマクロである].これは最初に getc () が呼びだされ， 
入力行全体を読み，その行をバッファに人れることを意味している.それから， 
getc () はバッファ中の最初の文字をかえす. 2回目に getc () が呼びだされる 
と，バッファに2番目の文字をかえす. getc () はバッファに文字がなくなるま 
でキーボードに文字を取りには行かない.入カキーをひとつたたいても，プログ 
ラムが入力関数として getc () を使用しているならば，プログラムからの動作を 
すぐには期待できない.最後にキャリッジ • リターンをつけて，行全体を入力す 
るまでは何も起こらない. 

コンハ。イラの中には第二の”直接”入力関数一 getch () と呼ばれる一を供給 
してこの問題を回避するものもある.その関数は，入力行をバッファに入れない- 
その他の コ ンパイラには，キーボードからの入力の操作方法を変更させる関数を 
供給している. UNIX はこの関数 ioctl () を呼ぶ. UNIX はプログラムを実行 
するまえに実行できる（例えば，シエルスクリプトの中から呼びだせる）システム. 
コール （ stty ) も持っている. stty row とタイプして端末機をバッファなしの入 
カモードにする . stty cooked は端末機をバッファ付き入カモ—ドにもどす•低 
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次元の I / O 関数 read () は入力をバッファに入れない.それで 

1 n t c ; 

read( fileno(stdin), &c,1); 

で一文字得ることができる. 

しかし， read () のこの使い方をサポートしないコンパイラもある.上記は何 
かが欠けている.自分のオペ レー ティ ング. システムと直接対話する ルーチンを 
書かなければならないだろう. 

10.10.3 変換される I / O 対変換されない I/O 

CP / M と MS - DOS システムにみられる，関連した問題は，変換を行う I / O と 
変換をしない I / O である • C 言語は，行の終わり（’ \ n ’） を表すのに1文字を使 
う. CP / M と MS - DOS は2文字シーケンス CF-LF (0 x 0 d -0 x 0 a ) を使用する 
( UNIX は LF だけ使用する）.したがって，入力関数は通常 CR - LF シーケンス 
を入力では1文字の’ \ n ’ に変換し，出力では’ \ n ’ を CR - LF にもどす.この 
動作は，2進データの読込みでは問題になることがある.たいていのコンパイラ 
は I / O 変換を停止する方法がある.もっとも普通の方法は 
f p = f open( "file", "r"); 

の変換読み込みでファイルをオープンし，一方 

f p = f open( "file", "rb"); 

の不変換読み込み， 2 進モード （binary mode ) でファイルをオープンする.キ 
—ボードから不変換で入力が必要ならば，直接デバイスとやりとりすることがで 
きる.詳しくはコンパイラの使用説明書を調べればよい. 

DOS では，コンソール用に別のフアイルポインタをつくることができる. 


fp = 

f open( 

"con". 

•• r b " 

) 

fp = 

f open( 

"con:". 

» r b M 

) 

fp = 

f open( 

"/dev/con". 

•' rb" 

) 


図10,6にこの機構を使用して直接プリンタに書く方法を示す. 

UNIX では，端末機と直接会話するためには 

fp = f open( "/dev/ttyNN" f "r"); 

と書かなくてはならない • NN は自分の端末機の tty ナンバーで置き換える (who 
か whoami コマンド を使うと， こ の数を 得 られる）. 

/dev ディレクトリは，すべてのハードウエア装置をアクセスするために， UNIX 
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/^include < s t d i 〇 . h > 
ma i n() 

FILE *lp r ; 

if( !( l p r = fopen("/dev/prn", "wb"))) 

printfC Can't open p r i n t e r \ n 11 ); 

else 

fprintf(lpr , "Quo usque tandem abutere...patientia nostra\n"); 


図 10 . 6 MS-DOS 下のプリンタに直接の書込み 


によって使われている. / dev はオペレーテイング.システム（自分のコンパイラ 
の I / O ライブラリではない）によって管理されている架空のディレクトリである. 
その中のフアイルは実際は I / O システムにあるデバイスである. 

DOS は，ファイル名 con を特別なものとして認識する. con があるディレクト 
リが重要なのではない.つまり， / foo / con とすることもできる.厳密にいえば， 
DOS のデ八イスに書くときには con :， con , CON ， または CON :を使う.コン 
パイラの中には，小文字は受け入れないものもある.あるいは，小文字を要求す 
るものもある.最後のコロンがなければならないもの （con :のように）もある. 
そして，やはリコロンが使えないものもある. DOS 自体は / dev / con を受け入れ 
るので，筆者が知るコンパイラはすべてこれを受け入れる.それで， / dev / con は 
他のものより移ネ直性があるように思われる. 

10.11 演算子を除く最適化プログラム 

読者が書いたプログラムは，まったく間違っていないときでも，コンパイラが 
最適化しながら，そのプログラムをごみにかえてしまうことがある.たいていの 
最適化プログラムに関係する問題は，コンパイルするとき最適化しなければ簡単 
に解決できる.通常，コマンドのスイッチかコンパイラの最適化のパスを実行し 
ないことで，最適化を行わないようにできる. 

いくつか例をあげる.数の最上位ビットをクリア （0 にセット）する次のプロ 
グラムをみてみる. 


unsigned x ; 
x = (x << 1) >> 1; 


最適化プログラムは，右シフトが続く左シフトは何もしないのと同じであると 
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考え，その行を無視する.もちろん， 

x &= (unsigned)(-1) >> 1; 

の方がよい. 

メモリ •マップ ドの ハードウェアに イ ンターフェースして いるときに表れる， 
もっと現実的な問題がある.それは ハー ドウ ェアの 事象が出カポートへ書きだす 
ことから始まる. ハー ドウ ェアは， 何をポートに 書いた のか関知し ない.ただア 
ドレスされるポートを見張っているだけである.つまり 

hardware.register =1; 
for( i = DELAY; — i >= 0 ) 

f 

hardware.register =1; 

のような状況で，最適化プログラムは hardware . register に1が書かれたことを 
みることができる.最適化プログラムが2度目の書き込みを処理するとき，その 
間に他の命令によって hard wear . register を変更していないことに気づく.それ 
で，最適化プログラムは，その2度目の命令を省いて最適化する （2 度目の命令 
は実行されない）.関連問題がある. 


cl = uart.data 
c 2 = uart.data 

これは最適化プログラムによって次のように変更される. 

temp = uart.data 
c 1 - temp; 
c ど =temp; 


同様に 


uart.data = c; 
uart.data = e; 

のとき，最適化プログラムは， uart . data が最初に設定されてから 2 度目に設定 
されるまで使われないので，最初の代入を省略する.この問題はアナログ/デジ 
タル変換が使用されているときよく起こる.変換処理を始めるためにコンバ_夕 
に書き込む.それから直ちに変換結果を読む. 

char *atod = (char *) 0x1000; 

* a t od =1; 
c = *a t od; 

* atod に 1 を書くと変換が始まる.次の文は結果を読む. * atod は2つの文の 
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間で変更されたり使用されていないから，最適化プログラムがさきのプログラム 
を次のようにかえてしまう. 

* a t 〇 d =1; 


10. 12練 習 


10-1 max ( x ， y ) マクロと図10.3の2つのマクロを書きかえて，副作用が起き 
ないようにせよ.ただしこれらのマクロを，サブルーチンにかえてはいけ 
ない. 

10-2 次のプログラムで悪いところはどこか？ 


//include < s t d i 〇 . h > 

//define PR I NT ( d ) printfC'Got %d L i nes \ n" , d ); 


char 
i n t 


*buf ; 

c , count ; 


for(count = 0 ; c ; c our 

C 

i f( gets(buf) !: 


卜）； 


else 


1 f ( c 

PRINK count ); 


EOF ) 

*bu f == 0 ) 

printf("Got <%s>\n", buf ); 


10-3 次のプログラムは何をプリントするのか？ それはなぜか？ 


# def 1 ne islower(c) ( 1 a' <= (c) && (c) <= 'z ') 

# d e fin e toupper ( c ) (islower(c) ? (c) - ('a'- ' A') : (c)) 

m a i n () 

て 

char *p = "masonic dozens DEIfy forelock too .."; 
w h i L e ( * p ) 

prin t f(" % c", toupper(*p + +)); 
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XT. New York : Plume/Waite, 1984. 
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し， マイクロソフトのアセンブラには，参考図書がついていない.そのためのよ 
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Russell Rector and George Alexy. The 8086 Book. Berkeley : Osborne/ 
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ばれた本 （Principles of Compieler Design) を書き直したものである.不幸な 


282 


参 


考 


文 


献 


ことに，たいていの数学書と同様に，あまり読みやすくはない•不必要に複雑な 
形で単純な概念が説明されていて，実用的なプログラム例はほとんどない.読み 
やすいが理解が難しい本は 

P.M. Lewies, D. J. Rosenkrantz and R. E. Stearns. Compiler Design 
Theory. Reading Mass. * Addison-Wesley ， 1976. 

である.最後に全体的に実用的な本は 

Per Brinch Hansen. Brinch Hansen on Pascal Compilers. Englewood 
Cliffs, N. J. * Prentice-Hall, 1985. 

である . YACC と LEX は，文法とトークンの記述を人力とし，構文解析プログ 
ラムと字句解析プログラム用の C 言語のソースプログラムを出力とする.私が知 
っている YACC と LEX の使用法のもっともよい記述は 

Axel T. Schreiner and H. George Friedman, Jr. Introduction to Com¬ 
piler Construction with UNIX. Englewood Cliffs ， N. J. ■ Prentice- 
Hall, 1985. 

である . コンパイラに関係する話題は，ルートまたはスタータップ•モジュール 
である . UNIX ライクのリディレクションやパイプ，ワイルドカード拡張のサボ 
— 卜をするために ， Aztec CII を改造する例がのっている本を次に示す . 

Allen Holub, “C-Chest” ， Dr. Dobb’s Journal of Software Tools, 101 
(March, 1985) pp.10-28. 


ツ ー ル 

役にたつ UNIX ツール やプログラムが IBM PC 用にもある . 

SH は， MS-DOS で動作する UNIX C シェルをスケールダウンしたバージョン 
である.これは Dr. Dobb’s Catalog (M & T Publishing, 501 Galveston Drive, 
Redwood City, Calif. 94063 (8001528-6050) からでている . grep のバージ 
ョンのひとつを含んでいる UNIX ライクのユーテイリテイ （ /util )• パッケージ 
は前と同じところから出版されている . どちらのパッケージも，ディスクで実 
行形式のプログラムとその ソース プログラムがいっしよにくる.それらは大変役 
にたつプログラムで，実際的な大きさの C プログラムのよい例でもある . M & 
T は Dr.Dobb’s Toolbox にあるプログラムのいくつかをマシン•リーダブルの 
バージョン にしてだしている . （小さな C コンパイラとアセンブラ，テキスト処 
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理のツール，等）すべて完全な C ソースプログラムが含まれている. 
make ユーテイリテイの バージョンがいろいろ Polytron Software ( P . 0. Box 
787, Hillsboro , OR 97123 ; 5031648-8595)と Lattice Inc . ( P . O.Box 3072, 
Glen Ellyn , Ill . 60138; 3121858-7950)からでている . Polytron バージョンは 
polymake と呼ばれ，かなり UNIX コンパチブルである. Lattice バージョンは 
LMK と呼ばれ，少し高額だが走行中のメモリは少ししかいらない.他にも make 
のバージョンはコンパイラとともに供給されている（これを書いたときには， 
Microsoft C , Aztec C , Datalight C はみな make を含んでいた）.飾りのない 
make のソースプログラムが1985年の7月に c-chet ( Dr . Dobb’s Journal , 105, 
p . 20 f ) でだされた. 

lint のよいバージョンは PC - lint である.これは Gimple Software , 3207 Hogath 
Lane , Collegville ， PA , 19426 ; (215)584-4261, から出されている. 

コンパイ ラはしばしば変更されるので， コンパイ ラについては述べていない•こ 
こで述べてもほとんど意味がなくなってしまうだろう•コンノ、。イラを買いたいの 
ならば最近発行されたコンピュータの技術雑誌を読んでみればよい. Dr . Dobb，s 
Journal , the PC Tech Journal , Computer Language Magazine が出版されて 

いる. 
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-= /= %= >>= &= etc. 


()[] -〉 1 . 2 

!〜++ -- - 3 (type) & 5 sizeof 

* 6 / % 


« » 

<<=>>= 


left to right 
right to left 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 
left to right 


優先順位図 

Associativity: Operator: 


注： 

1. 間接的な（ポインタによる）構造体のメンバ 

2. 構造体のメンバ 
3. 1項演算子の一 

4 . さし示されるオブジェクト 

5. アドレス 


II 8 & 

II &<&=?:一 - 9, 
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6. かけ算 
7.2 進の一 

8. ビツト每の AND 

9. カンマ演算子 

下の行にある方が優先度が低い. 



付 録 B 


シェル•ソート 

私は長い間，シェル•ソートはシェルゲーム（貝遊び）にちなんで名づけられ 
たと思っていた . K & R のソート•ルーチンを解いてみようとした人ならば， 
どうして私がこの結論に達したのか理解できるだろう.実は，そのアルゴリズム 
の名前は，開発者 Donald Shell に由来する.彼は1959年に作成した.シヱル. 
ソートは，ソートの対象を小さく分けて動作する.例えば，8要素の集合を2要 
素の小集合4つに分けて，各小集合内を独立してソートする.最後に8要素の1 
集合として格納する.小集合に分ける理論的根拠は，もとの集合のでたらめな順 
序のそれぞれの部分を，とてもはやく順序よく並べることが可能なことである. 
小集合の配列は次の段階では，もっとはやくソートが簡単になる.どうして小さ 
な集合に分けるのか？ 小集合にある要素を，実際にソートするアルゴリズムは 
たいしたものではない.ただし，このアルゴリズムの動作は，アルゴリズムを使 
用している集合が目的の順序に近づくにつれてよくなる. バブル. ソートはこの 
動作を行う.実際にはシヱル•ソートを改良された バブル •ソートとしてみるこ 
とができる. 

処理過程を示す具体的な例をあげる. 8要素の集合から始めよう. 

C9, 2,1, 7, 3, 8, 5, 〇 

これを4つの小集合19,3!，12,81, 11,51,17,41に分割する. 

9 217 3 8 5 4 
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それから，各小集合を独立にソートする. 

3 214 9 8 5 
1111111 


次に4要素の2つの小集合（13,1，9, 51，12,4,8, 71) にする. 

3 214 9 8 5 7 
11111111 


I 


これを別々にソートすると次のようになる. 

1 2 3 4 5 7 9 8 


最後に，8要素の1つの集合を入力として，ソートする.その結果は 


2 3 4 5 7 8 9 
1111111 


である. 

この処理過程を本書にあるプログラム（図7.16)と比較する.もっとも外側の 
for ループ（行 11) が，各小集合にいくつの要素があるかを決定する. gap は同 
じ小集合の2要素間の差である.実際の例では，9と3の最初の小集合の要素間 
の差は4である. 4が gap の初期値になる.この最初の for ループ内で gap を2 
で割る.それが効果的に小集合の要素数を2倍にする. 

2番目と3番目の for ループ (12, 13行）は，実際のソート. ルー チンであ 
る.同時に全小集合をソートするので複雑だが，アルゴリズムは基本的にパブ 
ル.ソートである.最後の場合 （ gap が 1) だけ扱うようにアルゴリズムを削減 
し，比較の判断文を逆にして，バブル•ソートをつくる.これでソートがどのよ 
うに動作するかみることができる. 

for( i =1; i < argc ; i++ ) 

f o r( j = i - 1;j >= 0 ；--]) 

i f ( s t r cmp( a 「 gv[j], argv[j + 1] > 0) 
ex c h( a 「 gv[j], a r g v [ j + 1]) 

もっとも内側のループでは，バブル.ソートはソ_卜されていない配列にそっ 
て，逆順の隣り合った2要素を探す.その2要素がみつかったら，それらの位置 











付 


録 


B 


289 


を交換する.このように順序よく並んでいない要素は，配列中で正しい位置にお 
かれる.比較と交換を束にして行わなければならない（ただし，最悪の場合の全 
要素が逆順に並んでいるとき，右端の要素を左端まで N —1回交換しなければな 
らない）.このもっとも内側のループは，誤った位置にある要素を全部，配列中の 
正しい位置におくために，十分な時間をかけて実行する必要がある. バブル •ソ 
—卜は常に 0( N 2 ) 比較を行う.最悪の場合は，比較回数と同じ回数の交換が必 
要である. バブル •ソートが遅いのはもっともなことであろう. 

もう読者は，どうしてシェル.ソートがバブル•ソートを強力にしたものであ 
るかわかっただろう.バブル•ソートは間違った位置にある要素を取り出し，〇 
( logN ) 回の交換で配列の前の方に移動させる.シヱル•ソートは，要素間の 
インクリメントでごまかして動作を向上させる.これはもっと生産的なやり方で 
種々のパスを互いに影響させる.イ•ンクリメントは互いに同じである必要はない. 
2のべき乗は，実際はインクリメントのもっとも悪い選択である. Knuth は魔法 
の力で1，4，13, 40,121，（（121*3)+1)，…がインクリメントのよい選択枝で 
あると決定した•また彼は1，3, 7,15, 31， ."，2 N — 1のシーケンスがよく動作す 
るともいっている.インクリメントは後のシーケンスを使用して，シェル•ソー 
卜は N 要素の配列を 0( N L 2 ) 回でソートする.これはバブル.ソートの 0( N 2 ) 
よりもよい.もし興味があれば，この解析の詳細は Donald E . Kunth，The Art 
of Computer Programming , Vol . 3. ( Reading , Mass . * Addison - Wesley , 
1973) p .84 f . にある. 
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-' I 好評の既刊害より卜 
マスター C ハンドブック 
Craig Bolon 著 
寅市和男監訳 
(B 5判368頁) 

C 言語の誕生の背景から，その特徴，利 
点と限界,構造的プログラミングの内容， 
C の実行とサボートシステムまでを初学 
者にもわかるように，ていねいに解説し 
ています. 

く主要目次〉 

イントロダクション （ C 言語の特徴/簡 
単な C プログラムを窨く/他)/互換性の 
あるデータ（データ要素の型/記憶クラ 
ス/データ配列/ポインタ/他）/プログ 
ラムの構造（関数とモジュール/演算子 
/式の計算/制御文)/プログラミング環 
境（処理系の特性/プリプロセッサ機能 
/ C の関数ライブラリ/入出力関数/他） 

C プログラムテクニック 
椋田實 • 佐古卓史共編 
(A 5判240頁) 

C 言語について， パーソナルコンピュー 
夕用として広く用いられている DeSmet C 
をベースに，基本から実践までのプログ 
ラミング作法 •技法，文法， 0 S やハード 
ウェアとの関係上のテクニック，初学者 
が間違いやすいところを実用的なプログ 
ラム例を豊富に掲載してまとめたもので 
す. 

く主要目次〉 

基本的な命令•関数テクニック/プログ 
ラムの テクニック/プロ グラムの間違い 
やすい所/ハードウェアに依存するブロ 
グラム/付録 （DeSmet C コンパイラの操 
作， C 言語要約 , JIS C 6220 8単位符号表， 
16進 to 10進変換表) 

C プログラム入門 
大原茂之著 
(A 5判200頁) 

これから C 言語を学びプログラムを作ろ 
うとしている初学者を対象にプログラム 
例を豊富に挿入し，わかりやすく解説し 
ています. 

く主要目次〉 

C 言語入門/データ型と記憶クラス/デー 
夕構造と標準入出力/演算処理/ブログ 
ラムの実行制御/関数/ファイルの入出 
力 
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